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前 言 


自从 Java 语言 自 诞生 以 来 ， 经 过 十 多 年 的 发 展 和 应 用 ， 已 经 成 为 当今 最 流行 的 编程 语 
言 之 一 。 根 据 某 权威 编程 语言 排行 榜 显示 ， 它 始终 居于 第 一 位 。 现 在 全 球 已 有 超过 15 亿 
部 手机 和 手持 设备 应 用 Java 技术 。 同 时 ，Java 技术 因 其 跨 平 台 特 性 和 良好 的 可 移植 性 ， 成 
为 广大 软件 开发 技术 人 员 的 挚爱 ， 是 全 球 程序 员 的 首选 开发 平台 之 一 。 

日 益 成 熟 的 Java 语言 编程 技术 现在 已 无 处 不 在 ， 使 用 该 编程 技术 可 以 进行 桌面 程序 应 
用 、Web 应 用 、 分 布 式 系统 和 媒 入 式 系统 应 用 开发 ， 并 且 在 信息 技术 等 各 个 领域 得 到 广泛 
应 用 。 

本 书 全 面 介绍 了 Java 虚拟 机 技术 的 核心 知识 ， 全 书 内 容 深入 并 详解 ， 作 者 用 通俗 的 语 
言 将 大 师 级 的 知识 展现 在 读者 的 眼前 。 


本 书 的 内 容 


通过 本 书 的 内 容 ， 细 致 分 析 了 Java 虚拟 机 开发 的 基本 知识 ， 和 读者 们 一 起 权衡 出 优 
化 、 高 效 和 安全 的 最 优 方案 。 本 书 内 容 新 颖 、 知 识 全 面 、 讲 解 详细 ， 全 书 分 为 17 章 ， 第 1 
章 讲解 一 起 走 进 Java 世界 的 基本 知识 ， 第 2 章 讲解 JDK 编译 测试 的 基础 知识 ， 第 3 章 讲 
解 安 全 性 考虑 的 核心 知识 ， 第 4 章 讲解 通过 网 络 实现 移动 性 的 知识 ， 第 5 章 浅 谈 Java 虚拟 
机 内 部 机 制 的 基础 知识 ， 第 6 章 深入 分 析 class 文件 的 核心 知识 ; 第 7 章 详细 讲解 栈 和 局 
部 变量 操作 的 知识 ， 第 8 章 深 入 详解 内 存 异常 和 垃圾 处 理 的 基本 知识 ， 第 9 章 讲解 高 效 手 
段 之 性 能 监控 工具 和 优化 部 署 的 核心 知识 ， 第 10 章 讲解 JVM 参数 分 析 和 调 优 实战 的 知 
识 ; 第 11 章 讲解 虚拟 机 类 加 载 机 制 的 基本 知识 ， 第 12 章 讲解 研究 高 效 之 魂 ;第 13 章 讲 
解 类 加 载 器 和 执行 子 系统 的 基本 知识 ; 第 14 章 讲解 编译 优化 的 基本 知识 ， 第 15 章 讲解 运 
行 期 优化 的 基本 知识 ， 第 16 章 讲解 内 存 模型 和 线程 的 基本 知识 ; 第 17 章 讲解 如 何 将 安全 
和 优化 合 二 为 一 。 全 书 内 容 循序 渐进 ， 并 且 逐 一 做 到 了 深入 剖析 。 


本 书 特色 


本 书 内 容 相 当 丰 富 ， 实 例 内 容 覆 盖 全 面 ， 满 足 Java 程序 员 成 长 道路 上 的 方方面面 。 我 
们 的 目标 是 通过 一 本 图 书 ， 提 供 多 本 图 书 的 价值 ， 读 者 可 以 根据 自己 的 需要 有 选择 地 阅 
读 ， 以 完善 本 人 的 知识 和 技能 结构 。 在 内 容 的 编写 上 ， 本 书 具 有 以 下 特色 。 

(1) 专家 写作 ， 内 容 专 业 而 深入 

本 书 是 国内 一 线 著 名 的 Java 专家 级 作者 的 力作 。 为 了 本 书 确保 广度 和 深度 ， 本 书 并 没 
有 将 大 量 篇 幅 用 在 规范 和 基本 语法 上 ， 而 是 专注 于 各 个 基本 知识 的 具体 细节 ， 尽 量 涉及 了 
每 个 知识 中 最 为 重要 的 内 容 ， 并 且 讨论 了 相关 的 高 级 用 法 技术 。 

本 书 既 是 介绍 性 书籍 ， 又 是 深入 研究 技术 性 书籍 。 本 书 实现 了 高 级 技术 与 介绍 性 知识 
并 重 的 效果 ， 为 了 达到 这 一 目标 ， 笔 者 做 过 大 量 研究 。 比 如 ， 参 与 论坛 讨论 ， 开 发 大 量 的 
实际 项 目 ， 参 加 学 术 会 议和 研讨 会 ， 同 时 跟 制定 Java 规范 的 专家 组 进行 沟通 ， 同 全 世界 顶 


fi avast 


二 4 皇权 街 化 化 、 高 效 和 安全 的 最 优 方案 
级 专家 进行 合作 。 
(2) 结构 合理 


从 用 户 的 实际 需要 出 发 ， 科 学 安排 知识 结构 ， 内 容 由 浅 入 深 ， 统 述 清楚 ， 具 有 很 强 的 
知识 性 和 实用 性 ， 反 映 了 Java 虚拟 机 的 核心 知识 。 同 时 全 书 精 心 筛选 的 最 具 代表 性 、 读 者 
最 关心 典型 知识 点 ， 几 乎 包括 虚拟 机 技术 的 各 个 方面 。 

(3) 易学 易 懂 

本 书 条 理 清晰 、 语 言 简 洁 ， 可 帮助 读者 快速 掌握 每 个 知识 点 ， 每 个 部 分 既 相互 连贯 又 
自 成 体系 ， 使 读者 既 可 以 按照 本 书 编排 的 章节 顺序 进行 学 习 ， 也 可 以 根据 自己 的 需求 对 某 
一 章节 进行 针对 性 的 学 习 。 

(4) 由 浅 入 深 

本 书 从 Java 语言 的 发 展 、 开 发 环境 及 基本 语法 知识 入 手 ， 逐 步 介绍 了 JDK 编译 测 
试 、 安 全 性 、 移 动 性 、 虚 拟 机 的 内 部 机 制 、class 文件 、 栈 和 局 部 变量 操作 、 内 存 异 常 、 垃 
圾 处 理 、 性 能 监控 工具 和 优化 部 署 、 类 的 加 载 机 制 、 类 加 载 器 和 执行 子 系统 、 编 译 优化 等 
知识 。 保 证 让 读者 在 没有 编程 基础 的 情况 下 ， 也 能 够 很 快 掌握 Java 虚拟 机 的 各 种 技术 。 

(5) 实用 性 强 

本 书 彻底 握 弃 枯燥 的 理论 和 简单 的 操作 ， 注 重 实用 性 和 可 操作 性 ， 详 细 讲解 了 各 个 部 
分 的 源码 知识 ， 使 用 户 掌握 相关 的 操作 技能 的 同时 ， 还 能 学 习 到 相应 的 基础 知识 。 


读者 对 象 

初学 编程 的 自学 者 编程 爱好 者 

大 中 专 院 校 的 老师 和 学 生 相关 培训 机 构 的 老师 和 学 员 
毕业 设计 的 学 生 初中 级 程序 开发 人 员 

程序 测试 及 维护 人 员 参加 实习 的 初级 级 程序 员 
在 职 程序 员 资深 程序 员 


本 团队 在 编写 编写 过 程 中 ， 得 到 了 清华 大 学 出 版 社工 作 人 员 的 大 力 支 持 。 但 是 本 团队 
水 平 毕竟 有 限 ， 如 有 丝 漏 和 不 尽 如 人 意 之 处 在 所 难免 ， 诚 请 读者 提出 意见 或 建议 ， 以 便 修 
订 并 使 之 更 臻 完善。 另外， 为 了 方便 读者 学 习 ， 我 们 特 开通 了 技术 支持 QQ 群 ， 群 号 为 
75593028， 欢 迎 读者 加 入 本 群 。 
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一 起 走 进 Java 世界 


几乎 所 有 学 习 计算 机 的 朋友 都 听 说 过 Java 语言 ，Java 语言 “犀利 无 
比 ”， 已 占据 了 当前 软件 应 用 的 半壁 江山 。 本 章 将 首先 带领 读者 领略 Jova 这 
门 强大 的 语言 ， 仔 细 品 i ， 并 且 详 细 分 析 Java 技术 体系 
的 构成 ， 为 Java 程序 员 规 划 发 展 之 路 。 


aa 志 拉 机 开发 


一 用 一 


= 人 < 权衡 优化 、 高 效 和 安全 的 最 优 方 案 


1.1 Java 的 优势 


Java 语言 在 编程 语言 中 占据 了 重要 地 位 ， 用 Java 开发 的 项 目 分 布 在 世界 各 地 的 各 个 领 
域 。 为 了 让 读者 学 好 Java 语言 更 有 信心 ， 本 节 首 先 介绍 学 习 Java 语言 的 优势 。 


1.1.1 排名 第 一 的 编程 语言 


都 说 Java 语言 是 使 用 率 最 高 的 一 门 编程 语言 ， 并 且 没 有 之 一 。 表 1-1 是 最 新 的 编程 语 
言 排行 榜 ， 截 止 至 2012 年 2 月。 


表 1-1 编程 语言 排行 榜 (截止 至 2012 年 2 月 ) 


使 用 率 /% 
17.050 
16.523 
8.653 
7.853 
7.062 
5.641 


1.1.2 ”提供 给 我 们 美好 的 就 业 前 景 


由 表 1-1 的 统计 数据 可 以 看 出 ，Java 语言 是 当今 使 用 率 最 高 的 编程 语言 。 使 用 率 如 此 
之 高 ， 也 决定 了 Java 程序 员 的 就 业 机 会 要 大 于 其 他 开发 者 。 
Java 的 功能 比较 强大 ， 在 服务 器 领域 、 移 动 设备 、 桌 面 应 用 和 Web 领域 都 占据 了 重要 
的 地 位 。 
口 ” 服 务 器 领域 ，Java 在 服务 器 编程 方面 很 强悍 ， 拥 有 很 多 其 他 语言 所 没有 的 优势 。 
口 “ 移 动 设备 : Java 在 手机 领域 的 应 用 比较 广泛 ， 手 机 Java 游戏 随处 可 见 ， 当 前 异常 
火爆 的 移动 开发 平台 一 一 Android， 上 面 的 应 用 项 目 基本 上 都 是 用 Java 开发 的 。 
口 “桌面 应 用 : Java 和 C++、.NET 一 样 重要 ， 影 响 着 桌面 程序 的 发 展 。 
口 ”Web 领域 : Java Web 有 着 巨大 的 优势 ， 无 论 是 开发 工具 还 是 开发 框架 都 是 开源 
的 ， 并 且 安 全 性 更 强 。 
正 是 因为 Java 语言 可 以 在 多 个 领域 开发 项 目 ， 所 以 市 面 上 需要 多 个 领域 的 Java 程序 
员 。 据 统计 ， 当 前 全 球 有 30 亿 Java 器 件 正在 运行 着 Java 程序 ，500 多 万 Java 开发 者 活跃 
在 地 球 的 每 个 角落 ， 数 以 千 万 计 的 Web 用 户 每 次 上 网 都 亲历 Java 的 威力 。 今 天 ，Java 运 
行 在 9.08 亿 手 机 、10 亿 智 能 卡 和 10 亿 PC 上 ， 并 为 28 款 可 兼容 的 应 用 服务 器 提供 了 功能 
强大 的 平台 。 这 么 多 应 用 ， 彻 底 改变 了 用 户 的 生活 。 越 来 越 多 的 企业 ， 因 为 使 用 了 Java 而 
提高 了 生产 效率 。 在 中 国 ， 越 来 越 多 的 用 户 ， 因 为 Java 而 降低 了 成 本 ， 享 受 了 生活 。 
作为 唯一 在 互联 网 上 开发 的 语言 ，Java 平台 以 其 移动 性 、 安 全 性 和 开放 性 受到 追捧 。 据 
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IDC 预计 ， 自 2010 年 起 的 其 后 5 年 内 ， 采 用 Java 的 IT 产品 的 价值 将 翻番 ， 在 2015 年 将 达 
到 45.53 亿美 元 ， 年 增长 率 为 14.9%。 截 止 到 2010 年 5 月 ，Java 的 注册 开发 商 超过 1300 万 
人 ， 对 JRE(Java 运行 环境 ) 的 下 载 达 9200 万 次 。 詹 姆 斯 。 戈 士 林 博 士 预 计 在 3 一 5 年 内 Java 
技术 开发 商 将 发 展 到 2000 万 ， 无 线 Java 也 在 迅速 攀升 。 

上 述 发 展 趋势 在 国内 更 是 如 此 ， 当 前 我 国 对 软件 人 才 的 需求 已 达 50 万 ， 并 且 以 每 年 
20% 左 右 的 速度 增长 。 在 未 来 5 年 内 ， 合 格 软件 人 才 的 需求 将 远大 于 供给 。 在 过 去 的 2011 
年 ， 我 国 软件 人 才 的 缺口 已 达 52.5 万 人 ， 其 中 尤 以 Java 人 才 最 为 缺乏 。 

根据 IDC 的 统计 数字 ， 在 所 有 软件 开发 类 人 才 的 需求 中 ， 对 Java 工程 师 的 需求 达到 
全 部 需求 量 的 60%~70%。 这 也 就 不 难 解 释 在 智联 招聘 和 51job 等 主流 招聘 网 站 ， 随 处 可 见 
Java 工程 师 的 招聘 广告 了 。 


1.2 学 习 Java 需要 了 解 的 那些 事 


了 解 了 学 习 Java 语言 的 优势 之 后 ， 接 下 来 需要 了 解 和 这 门神 奇 语言 相关 的 几 件 大 事 ， 
下 面 介绍 这 门神 奇 语言 的 发 展 历史 和 特点 等 ， 为 读者 学 习 本 书后 面 的 知识 打下 理论 基础 。 


1.2.1 品 Java 语言 的 发 展 历史 


Java 是 由 Sun Microsystems 公司 于 1995 年 5 月 推出 的 Java 程序 设计 语言 (以 下 简称 
Java 语言 ) 和 Java 平台 的 总 称 。 用 Java 实现 的 HotJava 浏览 器 (支持 Java Applet) 向 我 们 展示 
了 Java 语言 的 魅力 一 一 跨 平 台 、 动 态 的 Web、Internet 计算 。 从 那 以 后 ，Java 便 被 广大 程 
序 员 和 企业 用 户 广泛 接受 ， 成 为 了 当今 最 受 欢迎 的 编程 语言 之 一 。 

Java 平台 由 Java 虚拟 机 (Java Virtual Machine) 和 Java 应 用 编程 接口 (Application 
Programming Interface，APD 构 成 。Java 应 用 编程 接口 为 Java 应 用 提供 了 一 个 独立 于 操作 
系统 的 标准 接口 ， 可 分 为 基本 部 分 和 扩展 部 分 。 在 硬件 或 操作 系统 平台 上 安装 一 个 Java 平 
台 之 后 ，Java 应 用 程序 就 可 运行 。 现 在 Java 平台 已 经 嵌入 了 几乎 所 有 的 操作 系统 。 这 样 
Java 程序 可 以 只 编译 一 次 ， 就 在 各 种 系统 中 运行 。Java 应 用 编程 接口 已 经 从 1.1x 版 发 展 到 
1.2 版 。 目 前 常用 的 Java 平台 基于 Java 1.6， 最 新 版 本 为 Java 1.7。 

当 1995 年 Sun 公司 推出 Java 语言 之 后 ， 全 世界 的 目光 都 被 这 个 神奇 的 语言 所 吸引 。 
那么 Java 到 底 有 何 神奇 之 处 呢 ? Java 语言 其 实 最 早 诞生 于 1991 年 ， 起 初 被 称 为 OAK 语 
言 ， 是 Sun 公司 为 一 些 消 费 性 电子 产品 而 设计 的 一 个 通用 环境 。Sun 公司 的 最 初 目的 是 为 
了 开发 一 种 独立 于 平台 的 软件 技术 ， 而 且 在 网 络 出 现 之 前 OAK 是 默默 无 闻 的 ， 甚 至 差 一 
点 天 折 。 但 是 随 着 网 络 的 出 现 彻底 改变 了 OAK 的 命运 。 在 Java 出 现 以 前 ，Intemet 上 的 信 
息 都 是 一 些 乏 味 死板 的 HTML 文档 。 这 对 于 那些 迷恋 于 Web 浏览 的 人 们 来 说 简直 不 可 容 
忍 。 他 们 迫切 希望 能 在 Web 中 看 到 一 些 交互 式 的 内 容 ， 开 发 人 员 也 极 希 望 能 够 在 Web 上 
创建 一 类 无 需 考虑 软 硬 件 平台 就 可 以 执行 的 应 用 程序 ， 当 然 这 些 程序 还 要 有 极 大 的 安全 保 
障 。 对 于 用 户 的 这 种 要 求 ， 传 统 的 编程 语言 显得 无 能 为 力 。Sun 的 工程 师 敏锐 地 察觉 到 了 
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这 一 点 ， 从 1994 年 起 ， 他 们 开始 将 OAK 技术 应 用 于 Web 上 ， 并 且 开 发 出 了 HotJava 的 第 
一 个 版 本 。 并 最 终 在 1995 年 ， 将 Java 技术 展现 在 了 世人 的 面前 。 
Java 分 为 以 下 三 个 体系 。 
口 ”JavaSE: 是 Java 2 Platform Standard Edition 的 缩写 ， 即 Java 平台 标准 版 。 
口 “JavaEE: 是 Java 2 Platform Enterprise Edition 的 缩写 ， 即 Java 平台 企业 版 。 
口 JavaME: 是 Java 2 Platform Micro Edition 的 缩写 ， 即 Java 平台 微型 版 。 
2009 年 4 月 20 日 ，Oracle( 甲 骨 文 ) 宣 布 成 功 收购 Sun 公司 ， 从 那 以 后 ，Java 成 为 了 软 
件 巨头 甲骨 文 旗下 的 一 款 产 品 ， 并 和 Oracle 数据 库 一 起 推动 着 世界 科技 继续 向 前 发 展 。 


1.2.2 Java 的 特点 


面向 对 象 : Java 语言 提供 了 类 、 接 口 和 继承 等 特性 。 为 了 简单 起 见 ，Java 只 支持 

类 之 间 的 单 继承 和 接口 之 间 的 多 继承 ， 并 且 也 支持 类 与 接口 之 间 的 实现 机 制 。 总 

之 ，Java 语言 是 一 门 纯粹 面向 对 象 的 程序 设计 语言 。 

口 ”简单 : Java 语言 的 语法 与 C 语言 和 C++ 语言 十 分 接近 ， 这 样 大 多 数 程序 员 可 以 很 
容易 地 学 习 和 使 用 Java。 并 且 Java 抛弃 了 C++ 中 的 操作 符 重 载 、 多 继承 、 自 动 强 
制 类 型 和 指针 等 知识 ， 这 将 更 加 利于 我 们 学 习 并 掌握 它 。 另 外 ，Java 还 提供 了 自 
动 废料 收集 机 制 ， 使 得 程序 员 不 必 再 为 内 存 管 理 而 担忧 。 

口 ”分 布 式 ， Java 语言 支持 Intemet 应 用 开发 ， 在 基本 的 Java 应 用 编程 接口 中 有 一 个 
网 络 应 用 编程 接口 (java.net)， 通 过 这 个 接口 提供 了 用 于 网 络 应 用 编程 的 类 库 ， 包 
插 URL、URLConnection、Socket、ServerSocket 等 。Java 的 RMI( 远 程 方法 激活 ) 
机 制 也 是 开发 分 布 式 应 用 的 重要 手段 。 

口 ”健壮 Java 的 强 类 型 机 制 、 异 常 处 理 、 废 料 的 自动 收集 等 是 Java 程序 健壮 性 的 重 
要 保证 。Java 通过 安全 检查 机 制 ， 使 Java 程序 更 具 健壮 性 。 

口 “ 可 移植 : 移植 性 是 指 能 够 在 不 同 的 开发 平台 和 服务 器 平台 上 使 用 。 因 为 Java 的 运 
行 环境 是 用 ANSI C 实现 的 ， 所 以 Java 系统 本 身 具有 很 强 的 可 移植 性 ， 可 以 在 很 
多 平台 上 运行 。 无 论 是 微软 的 产品 还 是 IBM 的 产品 ， 都 可 以 运行 Java 程序 。 

口 ”高 性 能 : 与 解释 型 的 高 级 脚本 语言 相 比 ，Java 的 确 是 高 性 能 的 。 随 着 JIT(Just-In- 
Time) 编 译 器 技术 的 发 展 ，Java 的 运行 速度 已 经 越 来 越 接近 于 C++。 

口 多 线程 ， 当 程序 需要 同时 处 理 多 项 任务 时 就 需要 多 线程 开发 ， 一 个 程序 在 同一 时 
间 只 能 做 一 件 事情 的 功能 过 于 简单 ， 肯 定 无 法 满足 现实 的 需求 。 在 实际 的 应 用 
中 ， 多 线程 开发 是 必 不 可 少 的 ， 多 线程 的 目的 是 在 同一 时 间 可 以 做 多 件 事情 。 并 
且 可 以 开启 多 个 线程 同时 做 一 件 事情 ， 这 样 可 以 提高 效率 。 不 管 是 C 语言 、C++ 
还 是 其 他 的 程序 设计 语言 ， 线 程 都 是 一 个 十 分 重要 的 知识 点 ， 多 线程 是 现代 开发 
软件 系统 的 发 展 方向 ，Java 作为 当今 的 主流 程序 设计 ， 它 当然 是 支持 多 线程 的 ， 
具有 并 发 性 ， 其 执行 的 效率 很 高 。 

口 “ 动 态 : Java 语言 的 设计 目标 之 一 是 适应 于 动态 变化 的 环境 。Java 程序 中 的 类 需要 

动态 地 被 载 入 到 运行 环境 中 ， 也 可 以 通过 网 络 来 载 入 所 需要 的 类 。 动 态 语言 的 好 
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处 是 有 利于 软件 升级 。 另 外 ，Java 中 的 类 有 一 个 运行 时 刻 的 表示 ， 能 进行 运行 时 
刻 的 类 型 检查 。 


1.3 ”剖析 Java 的 运行 机 制 


Java 语言 是 一 门 高 级 语言 ， 它 既 有 解释 型 语言 的 特性 ， 也 具有 编译 语言 的 特性 。Java 
需要 先 编译 ， 然 后 再 解释 运行 。 本 节 将 简要 介绍 Java 语言 的 运行 机 制 ， 更 加 深入 地 介绍 这 
门神 奇 的 语言 。 


1.3.1 高 级 语言 的 运行 机 制 

高 级 语言 按照 执行 方式 可 以 分 为 解释 型 和 编译 型 两 种 。 

1) 解释 型 语言 

计算 机 不 能 直接 理解 高 级 语言 ， 只 能 直接 理解 机 器 语言 ， 所 以 必须 要 把 高 级 语言 翻译 
成 机 器 语言 ， 计 算 机 才能 执行 高 级 语言 编写 的 程序 。 

翻译 的 方式 有 两 种 ， 一 种 是 编译 ， 一 种 是 解释 。 

解释 型 语言 的 程序 不 需要 编译 ， 省 了 道 工 序 ， 在 运行 程序 的 时 候 才 翻译 ， 比 如 解释 型 
Basic 语言 ， 专 门 有 一 个 解释 器 能 够 直接 执行 Basic 程序 ， 每 个 语句 都 是 执行 的 时 候 才 翻 
译 。 这 样 解释 型 语言 每 执行 一 次 就 要 翻译 一 次 ， 效 率 比较 低 ， 是 一 句 一 句 地 翻译 。 

2) 编译 型 语言 

编译 型 语言 写 的 程序 执行 之 前 ， 需 要 一 个 专门 的 编译 过 程 ， 把 程序 编译 成 为 机 器 语言 
的 文件 ， 比 如 exe 文件 ， 以 后 要 运行 的 话 就 不 用 重新 翻译 了 ， 直 接 使 用 编译 的 结果 就 行 了 
(exe 文件 )， 因 为 翻译 只 做 了 一 次 ， 运 行 时 不 需要 翻译 ， 所 以 编译 型 语言 的 程序 执行 效 
率 高 。 

编译 型 与 解释 型 ， 两 者 各 有 利弊 。 前 者 由 于 程序 执行 速度 快 ， 同 等 条 件 下 对 系统 要 求 
较 低 ， 因 此 像 开 发 操作 系统 、 大 型 应 用 程序 、 数 据 库 系统 等 时 都 采用 它 ， 像 C/C++、 
Pascal/Object Pascal(Delphi) 等 都 是 编译 语言 ， 而 一 些 网 页 脚本 、 服 务 器 脚本 及 辅助 开发 接 
口 这 样 的 对 速度 要 求 不 高 、 对 不 同系 统 平台 间 的 兼容 性 有 一 定 要 求 的 程序 则 通常 使 用 解释 
型 语言 ， 如 Java、JavaScript、VBScript、Perl、Python、Ruby、MATLAB 等 。 

但 随 着 硬件 的 升级 和 设计 思想 的 变革 ， 编 译 型 和 解释 型 语言 越 来 越 笼统 ， 主 要 体现 在 
一 些 新 兴 的 高 级 语言 上 ， 而 解释 型 语言 的 自身 特点 也 使 得 编译 器 厂商 愿意 花费 更 多 成 本 来 
优化 解释 器 ， 解 释 型 语言 性 能 超过 编译 型 语言 也 是 必然 的 。 


1.3.2 Java 的 运行 机 制 


Java 应 用 程序 的 开发 周期 包括 编译 、 下 载 、 解 释 和 执行 几 个 部 分 。Java 编译 程序 将 
Java 源 程序 翻译 为 JVM 可 执行 代码 一 一 字 节 码 。 这 一 编译 过 程 同 C/C++ 的 编译 有 些 不 
同 。 当 C 编译 器 编译 生成 一 个 对 象 的 代码 时 ， 该 代码 是 为 在 某 一 特定 硬件 平台 运行 而 产生 
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的 。 因 此 在 编译 过 程 中 ， 编 译 程序 通过 查 表 将 所 有 对 符号 的 引用 转换 为 特定 的 内 存 偏 移 
量 ， 目 的 是 保证 程序 运行 。Java 编译 器 不 将 对 变量 和 方法 的 引用 编译 为 数值 引用 ， 也 不 确 
定 程 序 执行 过 程 中 的 内 存 布局 ， 而 是 将 这 些 符 号 引用 信息 保留 在 字 节 码 中 ， 由 解释 器 在 运 
行 过 程 中 创立 内 存 布局 ， 然 后 再 通过 查 表 来 确定 一 个 方法 所 在 的 地 址 。 这 样 就 有 效 地 保证 
了 Java 的 可 移植 性 和 安全 性 。 
运行 JVM 字 节 码 的 工作 是 由 解释 器 (Java 命令 ) 来 完成 的 。 整 个 解释 执行 过 程 分 为 以 下 
三 步 进 行 。 
口 ” 代 码 的 装 入 。 
口 ” 代 码 的 校 验 。 
口 ” ”代码 的 执行 。 
装 入 代码 的 工作 由 “类 装载 器 ”(Class LoadenD) 完 成 。 类 装载 器 负责 装 入 运行 一 个 程序 
需要 的 所 有 代码 ， 这 也 包括 程序 代码 中 的 类 所 继承 的 类 和 被 其 调用 的 类 。 当 类 装载 器 装 入 
一 个 类 时 ， 该 类 被 放 在 自己 的 名 字 空间 中 。 除 了 通过 符号 引用 自己 名 字 空 间 以 外 的 类 ， 类 
之 间 没 有 其 他 办 法 可 以 影响 其 他 类 。 在 本 台 计 算 机 上 的 所 有 类 都 在 同一 地 址 空间 内 ， 而 所 
有 从 外 部 引进 的 类 ， 都 有 一 个 自己 独立 的 名 字 空间 。 这 使 得 本 地 类 通过 共享 相同 的 名 字 空 
间 获 得 较 高 的 运行 效率 ， 同 时 又 保证 它们 与 从 外 部 引进 的 类 不 会 相互 影响 。 当 装 入 了 运行 
程序 需要 的 所 有 类 后 ， 解 释 器 便 可 确定 整个 可 执行 程序 的 内 存 布 局 。 解 释 器 为 符号 引用 同 
特定 的 地 址 空间 建立 对 应 关系 及 查询 表 。 通 过 在 这 一 阶段 确定 代码 的 内 存 布 局 ，Java 很 好 
地 解决 了 由 超 类 改变 而 使 子 类 裔 溃 的 问题 ， 同 时 也 防止 了 代码 对 地 址 的 非法 访问 。 
接 下 来 ， 被 装 入 的 代码 由 字 节 码 校 验 器 进行 检查 。 校 验 器 可 发 现 操作 数 栈 溢 出 、 非 法 
数据 类 型 转化 等 多 种 错误 。 通 过 校 验 后 ， 代 码 便 开始 执行 了 。 
有 如 下 两 种 Java 字 节 码 的 执行 方式 。 
(1) 即时 编译 方式 : 解释 器 先 将 字 节 码 编译 成 机 器 码 ， 然 后 再 执行 该 机 器 码 。 
(2) 解释 执行 方式 ， 解释 器 通过 每 次 解释 并 执行 一 小 段 代 码 来 完成 Java 字 节 码 程序 的 
所 有 操作 。 
在 Java 中 通常 采用 的 是 第 二 种 方法 ， 因 为 JVM 规格 描述 具有 足够 的 灵活 性 ， 这 使 得 
将 字 节 码 翻 译 为 机 器 代码 的 工作 具有 较 高 的 效率 。 对 于 那些 对 运行 速度 要 求 较 高 的 应 用 程 
序 ， 解 释 器 可 将 Java 字 节 码 即 时 编译 为 机 器 码 ， 从 而 很 好 地 保证 了 Java 代码 的 可 移植 性 
和 高 性 能 。 
Java 程序 的 运行 必须 经 过 编写 、 编 译 、 运 行 三 个 步骤 。 
口 ”编写 是 指 在 Java 开发 环境 中 进行 程序 代码 的 输入 ， 最 终 形成 后 级 名 为 .java 的 
Java 源 文件 。 

口 ”编译 是 指使 用 Java 编译 器 对 源 文件 进行 错误 排查 的 过 程 ， 编 译 后 将 生成 后 缀 名 
为 .class 的 字 节 码 文件 ， 这 不 像 C 语言 那样 最 终生 成 可 执行 文件 。 

口 ”运行 是 指使 用 Java 解释 器 将 字 节 码 文件 翻译 成 机 器 代码 ， 执 行 并 显示 结果 。 这 一 
过 程 如 图 1-1 所 示 。 
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Java 源 文件 Java 字 节 码 文件 Java 
(* java) 编译 器 (yclass) 解释 器 人 


1-1 Java 程序 的 运行 流程 


在 图 1-1 中 ， 字 节 码 文件 是 一 种 和 任何 具体 机 器 环境 及 操作 系统 环境 无 关 的 中 间 代 
码 ， 它 是 一 种 二 进 制 文件 ， 是 Java 源 文件 由 Java 编译 器 编译 后 生成 的 目标 代码 文件 。 编 
程 人 员 和 计算 机 都 无 法 直接 读 懂 字 节 码 文件 ， 它 必须 由 专用 的 Java 解释 器 来 解释 执行 ， 因 
此 Java 是 一 种 在 编译 基础 上 进行 解释 运行 的 语言 。 

Java 解释 器 负责 将 字 节 码 文件 翻译 成 具体 硬件 环境 和 操作 系统 平台 下 的 机 器 代码 ， 以 
便 执行 。 因 此 Java 程序 不 能 直接 运行 在 现 有 的 操作 系统 平台 上 ， 它 必须 运行 在 被 称 为 Java 
虚拟 机 的 软件 平台 之 上 。 


1.3.3 Java 虚拟 机 一 一 JVM 


JVM 是 一 种 用 于 计算 设备 的 规范 ， 可 用 不 同 的 方式 (软件 或 硬件 ) 加 以 实现 。 编 译 虚 拟 
机 的 指令 集 与 编译 微 处 理 器 的 指令 集 非常 类 似 。Java 虚拟 机 包括 一 套 字 节 码 指 令 集 、 一 组 
寄存 器 、 一 个 栈 、 一 个 垃圾 回收 堆 和 一 个 存储 方法 域 。 

Java 虚拟 机 (JVM) 是 可 运行 Java 代码 的 假想 计算 机 。 只 要 根据 JVM 规格 描述 将 解释 
器 移植 到 特定 的 计算 机 上 ， 就 能 保证 经 过 编译 的 任何 Java 代码 能 够 在 该 系统 上 运行 。 

1) 为 什么 要 使 用 JVM 

Java 语言 的 一 个 非常 重要 的 特点 就 是 与 平台 的 无 关 性 ， 而 使 用 Java 虚拟 机 是 实现 这 一 
特点 的 关键 。 一 般 的 高 级 语言 如 果 要 在 不 同 的 平台 上 运行 ， 至 少 需要 编译 成 不 同 的 目标 代 
码 。 而 引入 Java 语言 虚拟 机 后 ，Java 语言 在 不 同 平台 上 运行 时 不 需要 重新 编译 。Java 语言 
使 用 模式 Java 虚拟 机 屏蔽 了 与 具体 平台 相关 的 信息 ， 使 Java 语言 编译 程序 只 需 生 成 在 
Java 虚拟 机 上 运行 的 目标 代码 ( 字 节 码 )， 就 可 以 在 多 种 平台 上 不 加 修改 地 运行 。Java 虚拟 
机 在 执行 字 节 码 时 ,把 字 节 码 解释 成 具体 平台 上 的 机 器 指令 执行 。 

2) JVM 的 作用 

Java 虚拟 机 (JVM) 是 运行 Java 程序 的 软件 环境 ，Java 解释 器 就 是 Java 虚拟 机 的 一 部 
分 。 在 运行 Java 程序 时 ， 首 先 会 启动 JVM， 然 后 由 它 来 负责 解释 执行 Java 的 字 节 码 ， 并 
且 Java 字 节 码 只 能 运行 于 JVM 之 上 。 这 样 利用 JVM 就 可 以 把 Java 字 节 码 程序 和 具体 的 
硬件 平台 以 及 操作 系统 环境 分 隔 开 来 ， 只 要 在 不 同 的 计算 机 上 安装 了 针对 于 特定 具体 平台 
的 JVM，Java 程序 就 可 以 运行 ， 而 不 用 考虑 当前 具体 的 硬件 平台 及 操作 系统 环境 ， 也 不 用 
考虑 字 节 码 文件 是 在 何 种 平台 上 生成 的 。JVM 把 这 种 不 同 软 硬 件 平台 的 具体 差别 隐藏 起 
来 ， 从 而 实现 了 真正 的 二 进 制 代码 级 的 跨 平 台 移植 。JVM 是 Java 平台 无 关 的 基础 ，Java 
的 跨 平台 特性 正 是 通过 在 JVM 中 运行 Java 程序 实现 的 。Java 的 这 种 运行 机 制 可 以 通过 
图 1-2 来 说 明 。 
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图 1-2 JVM 的 工作 方式 


Java 语言 这 种 “一 次 编写 ， 到 处 运行 (Write once，run anywhere)” 的 方式 ， 有 效 地 解 
决 了 目前 大 多 数 高 级 程序 设计 语言 需要 针对 不 同系 统 来 编译 产生 不 同 机 器 代码 的 问题 ， 即 
硬件 环境 和 操作 平台 的 异 构 问 题 ， 大 大 降低 了 程序 开发 、 维 护 和 管理 的 开销 。 

需要 注意 的 是 ，Java 程序 通过 JVM 可 以 达到 跨 平台 运行 ,但 JVM 是 不 跨 平台 的 。 也 
就 是 说 ， 不 同 操作 系统 上 的 JVM 是 不 同 的 ，Windows 平台 之 上 的 JVM 不 能 用 在 Linux 上 
面 ， 反 之 亦 然 。 


1.3.4 独特 的 垃圾 回收 机 制 


在 Java 的 众多 突出 特性 之 中 ， 垃 圾 回收 机 制 是 最 具 代表 性 的 一 个 。 在 C++ 中 ， 对 象 所 
占 的 内 存在 程序 结束 运行 之 前 一 直 被 占用 ， 在 明确 释放 之 前 不 能 分 配给 其 他 对 象 ， 而 在 
Java 中 ， 当 没有 对 象 引用 指向 原先 分 配给 某 个 对 象 的 内 存 时 ， 该 内 存 便 成 为 垃圾 。JVM 的 
一 个 系统 级 线程 会 自动 释放 该 内 存 块 。 垃 圾 收集 意味 着 程序 不 再 需要 的 对 象 是 “无 用 信 
息 ”， 这 些 信息 将 被 丢弃 。 当 一 个 对 象 不 再 被 引用 的 时 候 ， 内 存 回 收 它 占领 的 空间 ， 以 便 
空间 被 后 来 的 新 对 象 使 用 。 事 实 上 ， 除 了 释放 没 用 的 对 象 ， 垃 圾 收集 也 可 以 清除 内 存 记录 
碎片 。 由 于 创建 对 象 和 垃圾 收集 器 释放 丢弃 对 象 所 占 的 内 存 空间 ， 内 存 会 出 现 碎 片 。 碎 片 
是 分 配给 对 象 内 存 块 之 间 的 空闲 内 存 洞 。 碎 片 整理 将 所 占用 的 堆 内 存 移 到 堆 的 一 端 ，JVM 
将 整理 出 的 内 存 分 配给 新 的 对 象 。 

垃圾 收集 能 自动 释放 内 存 空间 ， 减 轻 编程 的 负担 ， 这 使 Java 虚拟 机 具有 一 些 优点 。 首 
先 ， 它 能 使 编程 效率 提高 。 在 没有 垃圾 收集 机 制 的 时 候 ， 可 能 要 花 许多 时 间 来 解决 一 个 难 
懂 的 存储 器 问题 。 在 用 Java 语言 编程 的 时 候 ， 其 垃圾 收集 机 制 可 大 大 节省 时 间 。 其 次 是 它 
能 保护 程序 的 完整 性 ， 垃 圾 收集 是 Java 语言 安全 性 策略 的 一 个 重要 部 分 。 

垃圾 收集 的 一 个 潜在 的 缺点 是 它 的 开销 影响 程序 性 能 。Java 虚拟 机 必须 追踪 运行 程序 
中 有 用 的 对 象 ， 而 且 最 终 释放 没 用 的 对 象 。 这 一 过 程 需要 花费 处 理 器 的 时 间 。 其 次 是 垃圾 
收集 算法 的 不 完备 性 ， 早 先 采 用 的 某 些 垃圾 收集 算法 就 不 能 保证 100% 收 集 到 所 有 的 废弃 
内 存 。 当 然 随 着 垃圾 收集 算法 的 不 断 改 进 以 及 软 硬 件 运行 效率 的 不 断 提 升 ， 这 些 问 题 都 可 
以 迎刃而解 。 
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1.4 剖析 Java 语言 体系 


Java 语言 博大 精深 ， 是 现实 应 用 中 使 用 最 多 的 一 门 编程 语言 。Java 语言 的 应 用 范围 之 
广 ， 作 为 一 名 学 习 者 ， 或 者 一 名 程序 员 ， 只 能 循序 渐进 地 从 基础 开始 学 习 ， 或 者 专门 向 一 
个 分 支 “ 倾 斜 ”发 展 。 只 要 读者 明确 自己 将 向 哪 一 方面 发 展 ， 那 么 接 下 来 的 内 容 便 可 以 帮 
助 大 家 明确 学 习 什 么 内 容 才 能 实现 自己 的 目标 。 


1.4.1 Java 程序 员 的 6 个 级 别 
所 谓 6 个 级 别 ， 只 是 笔者 的 观点 ， 其 实 并 没有 权威 性 ， 但 是 有 较 强 的 代表 性 。 
1. 第 一 个 级 别 一 一 普通 Java 程序 员 


需要 学 习 并 掌握 下 面 的 内 容 。 
1) Java 开发 环境 
JDK、 TVM、 Eclipse、 Linux。 
2) Java 核心 编程 技术 
学 习 Java 必须 从 Java 开发 环境 开始 ， 到 Java 语法 ， 再 到 Java 的 核心 API。 
口 Java 开发 入 门 : Java 开发 环境 的 安装 与 使 用 ， 包 括 JDK 命令 、Eclipse IDE、 
Linux 下 Java 程序 的 开发 和 部 署 等 。 
口 ”Java 语法 基础 : 基于 JDK 和 Eclipse 环境 ， 进 行 Java 核心 功能 开发 ， 掌 握 Java 面 
向 对 象 的 语法 构成 ， 包 括 类 、 抽 象 类 、 接 口 、 最 终 类 、 静 态 类 、 匿 名 类 、 内 部 
类 、 异 常 的 编写 。 
口 Java 核心 API: 基于 JDK 提供 的 类 库 ， 掌 握 三 大 核心 功能 : 
> Java 核心 编程 : 包括 Java 编程 的 两 大 核心 功能 一 一 Java 输入 /输出 流 和 多 线 
程 ， 以 及 常用 的 辅助 类 库 一 一 实体 类 、 集 合 类 、 正 则 表达 式 、XML 和 属性 
文件 。 
> ”Java 图 形 编程 : 包括 Sun 的 GUI 库 AWT(Java2D、JavaSound、JMF) 和 
Swing、IBM 和 GUI 库 SWT 和 Jface; 
> Java 网 络 编程 ， Applet 组 件 编程 、Socket 编程 、NIO 非 阻 塞 Socket 编程 、 
RMI 和 CORBA 分 布 式 开发 。 
3) 核心 编程 
IO、 多 线程 、 实 体 类 、 集合 类 、 正 则 表达 式 、XML 和 属性 文件 。 
4) 图 形 编 程 
AWT(Java2D/JavaSound/JMF)、Swing、 SWT、JFace。 
5) 网 络 编程 
Applet、Socket/TCP/UDP、 NIO、 RMI、 CORBA. 
6) 高 级 特性 
反射 、 泛 型 、 注 释 符 、 自 动 装 箱 和 拆 箱 、 枚 举 类 、 可 变 参 数 、 可 变 返 回 类 型 、 增 强 循 
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环 、 静 态 导入 。 
2. 第 二 个 级 别 一 一 JavaEE 初级 软件 工程 师 
需要 学 习 并 掌握 下 面 的 内 容 。 


1) JSF 框架 开发 技术 

配置 文件 (页 面 导 航 、 后 台 Bean)、JSF 组 件 库 (JSF EL 语言 、HTML 标签 、 事 件 处 
、JSF 核心 库 ( 格 式 转 换 、 输 入 验证 、 国 际 化 )。 

2) JavaWeb 核心 开发 技术 

开发 环境 (Eclipse、Linux)。 
三 大 组 件 (JSP、JavaBean、Servlet)。 
扩展 技术 (EL、JSTL、Taglib)。 

网 页 开发 技术 (HTML、XML、CSS、JavaScript、AJAX)。 
数据 库 设 计 技术 (SQL、MySql、Oracle、SQLServer、JDBC)。 
3) Web 服务 器 
常用 的 服务 器 主要 有 Tomcat、Jetty、Resin 和 JbossWeb。 


3. 第 三 个 级 别 一 一 JavaEE 中 级 软件 工程 师 


需要 学 习 并 掌握 下 面 的 内 容 。 

1) Strutsl 表现 层 框架 

入 门 配置 、 核 心 组 件 、 标 签 库 、 国 际 化 、 数 据 校 验 、 数 据 库 开 发 、Sitemesh 集成 、 集 
成 Hibernate/iBATIS 。 

2) Struts2 表现 层 框 架 

入 门 配置 、 核 心 组 件 、 标 签 库 、 国 际 化 、 数 据 校 验 、Sitemesh 集成 转换 器 、 拦 截 器、 
集成 Hibernate/iBATIS 。 

3) Spring 业务 层 框 架 

入 门 配置 、IoC 容器 、MVC、 标 签 库 、 国 际 化 、 数 据 校 验 、 数 据 库 开 发 。 

4) Hibemate 持久 层 框架 

MySQL、 Oracle、SQL Server。 

5) iBATIS 持久 层 框架 

MySQL、 Oracle、SQL Server。 

6) Web 服务 器 

Tomcat、Jetty、Resin、JBossWeb。 


4. 第 四 个 级 别 一 一 Java 高 级 软件 工程 师 
需要 学 习 并 掌握 下 面 的 内 容 。 

(1) JavaWeb 开源 技术 与 框架 。 

(2) JavaWeb 分 布 式 开发 技术 。 

(3) JTA(Java 事物 管理 )。 

(4) JAAS(Java 验证 和 授权 服务 )。 
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(5) JINDI(Java 命名 和 目录 服务 )。 

(6) JavaMail(Java 邮件 服务 )。 

(7) JIMS(Java 信息 服务 )、WebService(Web 服务 )。 
(8) JCA(Java 连接 体系 )、JMS(Java 管理 体系 )。 

(9) 应 用 服务 器 (JbossAS、WebLogic、WebSphere)。 


5. 第 五 个 级 别 一 一 JavaEE 系统 架构 师 


需要 学 习 并 掌握 下 面 的 内 容 。 

1) 面向 云 架构 (COA) 

COA、SaaS、 网 格 计算 、 集 群 计算 、 分 布 式 计算 、 云 计算 。 

2) 面向 资源 架构 (ROA) 

ROA、RESI。 

3) 面向 Web 服务 架构 (SOA) 

WebService、SOA、SCA、ESB、OSGI、EAI。 

4) Java 设计 模式 

口 “ 创 建 式 模式 : 抽象 工厂 、 建 造 者 、 工 厂 方法 、 原 型 、 单 例 。 

口 “ 构 造型 模式 : 适配器、 桥接 、 组 合 、 装 饰 、 外 观 、 享 元 、 代 理 。 

口 行为 型 模式 ， 责任 链 、 命 令 、 解 释 器 、 和 迭代 子 、 中 介 者 、 备 忘 录 、 观 察 者 、 状 
态 、 策 略 、 模 板 方法 、 访 问 者 。 

5) Java 与 UML 建 模 

对 象 图 、 用 例 图 、 组 件 图 、 部 署 图 、 序 列 图 、 交 互 图 、 活 动 图 、 正 向 工程 与 逆向 工程 。 


6. 第 六 个 级 别 一 一 CTO 首席 技术 官 


需要 学 习 并 掌握 下 面 的 内 容 。 
发 展 战略 。 
技术 总 监 。 
团队 提升 。 
团队 建设 。 
项 目 管理 。 
产品 管理 。 


1.4.2 ”分析 Java 体系 的 构成 


从 传统 意义 上 来 看 ，Sun 官方 所 定义 的 Java 技术 体系 主要 包括 以 下 5 个 组 成 部 分 。 
口 ”Java 程序 设计 语言 。 

各 种 硬件 平台 上 的 Java 虚拟 机 。 

Class 文件 格式 。 

Java API 类 库 。 

来 自 商业 机 构 和 开源 社区 的 第 三 方 Java 类 库 。 
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通常 把 Java 程序 设计 语言 、Java 虚拟 机 和 Java API 类 库 统 称 为 Java Development 
Kit， 简 称 JDK。JDK 是 支持 Java 程序 开发 的 最 小 环境 。 另 外 ， 可 以 把 Java API 类 库 中 的 
Java SE API 子 集 和 Java 虚拟 机 这 两 部 分 统称 为 JRE (Java Runtime Environment)，JRE 是 支 
持 Java 程序 运行 的 标准 环境 。 
上 述 组 成 是 根据 每 个 部 分 的 功能 进行 划分 的 ， 如 果 按 照 Java 技术 关注 的 重点 业务 领域 
来 划分 ，Java 技术 体系 可 以 分 为 如 下 4 个 平台 。 
口 Java Card: 支持 一 些 Java 小 程序 (Applets) 运 行 在 小 内 存 设备 (如 智能 卡 ) 上 的 
平台 。 
口 Java ME(Micro Edition): 支持 Java 程序 运行 在 移动 终端 (手机 、PDA) 上 的 平台 ， 
对 Java API 有 所 精简 ， 并 加 入 了 针对 移动 终端 的 支持 ， 这 个 版 本 以 前 称 为 
J2ME。 
口 Java SE (Standard Edition): 支持 面向 桌面 级 应 用 (如 Windows 下 的 应 用 程序 ) 的 
Java 平台 ， 提 供 了 完整 的 Java 核心 API， 这 个 版 本 以 前 称 为 PSE。 
口 “Java EE(Enterprise Edition): 是 PEE 的 升级 ， 支 持 使 用 多 层 架 构 企业 应 用 (如 ERP、 
CRM 应 用 ) 的 Java 平台 ， 除 了 提供 Java SE API 外 ， 还 对 其 做 了 大 量 的 扩充 并 提 
供 了 相关 的 部 署 支持 。 


1.5 Java 虚拟 机 家 族 


本 书 的 主角 是 虚拟 机 (Virtual Machine)， 虚 拟 机 是 指 通过 软件 模拟 的 具有 完整 硬件 系统 
功能 的 、 运 行 在 一 个 完全 隔离 环境 中 的 完整 计算 机 系统 。 本 节 将 简要 介绍 Java 虚拟 机 的 基 
本 知识 。 


1.5.1 ”虚拟 机 的 用 途 


在 现实 应 用 中 ， 对 于 一 般 计 算 机 用 户 来 说 ， 最 常见 的 使 用 虚拟 机 的 情形 是 安装 双 系 
统 。 例 如 ， 在 Windows 平台 上 安装 一 个 虚拟 机 ， 然 后 在 这 个 虚拟 机 中 安装 Linux 操作 系统 
或 iOS 系统 ， 这 样 就 实现 了 双 系 统 功能 。 

正如 上 面 描 述 的 那样 ， 通 过 虚拟 机 可 以 在 一 台 物 理 计 算 机 上 模拟 出 一 台 或 多 台 虚 拟 的 
计算 机 ， 这 些 虚拟 机 就 像 真正 的 计算 机 那样 进行 工作 ， 例 如 ， 你 可 以 安装 操作 系统 、 安 装 
应 用 程序 、 访 问 网 络 资源 等 。 对 于 用 户 而 言 ， 它 只 是 运行 在 用 户 物 理 计 算 机 上 的 一 个 应 用 
程序 ， 但 是 对 于 在 虚拟 机 中 运行 的 应 用 程序 而 言 ， 它 就 是 一 台 真 正 的 计算 机 。 因 此 ， 当 在 
虚拟 机 中 进行 软件 评测 时 ， 可 能 系统 一 样 会 崩溃 ， 但 是 崩溃 的 只 是 虚拟 机 上 的 操作 系统 ， 
而 不 是 物理 计算 机 上 的 操作 系统 ， 并 且 使 用 虚拟 机 的 Undo( 恢 复 ) 功 能 ， 可 以 马上 恢复 虚拟 
机 到 安装 软件 之 前 的 状态 。 


1.5.2 理解 Java 虚拟 机 
JVM(Java 虚拟 机 ) 是 Java Virtual Machine 的 缩写 ， 它 是 一 个 虚构 出 来 的 计算 机 ， 是 通 
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过 在 实际 的 计算 机 上 仿真 模拟 各 种 计算 机 功能 来 实现 的 。Java 虚拟 机 有 自己 完善 的 硬件 架 
构 ， 如 处 理 器 、 堆 栈 、 寄 存 器 等 ， 还 具有 相应 的 指令 系统 。 


1. 为 什么 要 使 用 Java 虚拟 机 


Java 语言 的 一 个 非常 重要 的 特点 就 是 与 平台 的 无 关 性 ， 而 使 用 Java 虚拟 机 是 实现 这 一 
特点 的 关键 。 一 般 的 高 级 语言 如 果 要 在 不 同 的 平台 上 运行 ， 至 少 需要 编译 成 不 同 的 目标 代 
码 。 而 引入 : Java 语言 虚拟 机 后 ，Java 语言 在 不 同 平 台 上 运行 时 不 需要 重新 编译 。Java 语 
言 使 用 模式 : Java 虚拟 机 屏蔽 了 与 具体 平台 相关 的 信息 ， 使 得 Java 语言 编译 程序 只 需 生成 
在 Java 虚拟 机 上 运行 的 目标 代码 ( 字 节 码 )， 就 可 以 在 多 种 平台 上 不 加 修改 地 运行 。Java 虚 
拟 机 在 执行 字 节 码 时 ， 把 字 节 码 解释 成 具体 平台 上 的 机 器 指令 执行 。 


2. 谁 需要 了 解 Java 虚拟 机 


Java 虚拟 机 是 Java 语言 底层 实现 的 基础 ， 对 Java 语言 感 兴 趣 的 人 都 应 对 Java 虚拟 机 
有 个 大 概 的 了 解 。 这 有 助 于 理解 Java 语言 的 一 些 性 质 ， 也 有 助 于 使 用 Java 语言 。 对 于 要 
在 特定 平台 上 实现 Java 虚拟 机 的 软件 人 员 ，Java 语言 的 编译 器 作者 以 及 要 用 硬件 芯片 实现 
Java 虚拟 机 的 人 来 说 ， 则 必须 深刻 理解 Java 虚拟 机 的 规范 。 另 外 ， 如 果 想 扩展 Java 语 
言 ， 或 是 把 其 他 语言 编译 成 Java 语言 的 字 节 码 ， 也 需要 深入 地 了 解 Java 虚拟 机 。 


1.5.3 Java 虚拟 机 的 数据 类 型 


Java 虚拟 机 可 以 支持 的 Java 语言 的 基本 数据 类 型 如 下 。 
口 “byte: 1 字 节 ， 有 符号 整数 的 补 码 。 
short: 2 字 节 ， 有 符号 整数 的 补 码 。 
int: 4 字 节 ， 有 符号 整数 的 补 码 。 
long: 8 字 节 ， 有 符号 整数 的 补 码 。 
float: 4 字 节 ，IEEE754 单 精 度 浮 点 数 。 
double: 8 字 节 ，IEEE754 双 精 度 浮 点 数 。 
char: 2 字 节 ， 无 符号 Unicode 字符 。 
object: 对 一 个 Javaobject( 对 象 ) 的 4 字 节 引用 。 

口 “retumAddress: 4 字 节 ， 用 于 jsr/ret/jsr-w/ret-w 指令 。 

几乎 所 有 的 Java 类 型 检查 都 是 在 编译 时 完成 的 ， 上 述 列 出 的 原始 数据 类 型 的 数据 在 
Java 执行 时 不 需要 用 硬件 标记 。 操 作 这 些 原始 数据 类 型 数据 的 字 节 码 (指令 ) 本 身 就 已 经 指 
出 了 操作 数 的 数据 类 型 ， 例 如 ，iadd、ladd、fadd 和 dadd 指令 都 是 把 两 个 数 相 加 ， 其 操作 
数 类 型 分 别 是 int、long、float 和 double。 虚 拟 机 没有 给 boolean( 布 尔 ) 类 型 设置 单独 的 指 
令 。boolean 型 的 数据 是 由 integer 指令 ， 包 括 integer 返回 来 处 理 的 。boolean 型 的 数组 则 是 
用 byte 数组 来 处 理 的 。 虚 拟 机 使 用 IEEE754 格式 的 浮 点 数 ， 不 支持 IEEE 格式 的 较 旧 的 计 
算 机 ， 在 运行 Java 数值 计算 程序 时 可 能 会 非常 慢 。 

虚拟 机 的 规范 对 于 object 内 部 的 结构 没有 任何 特殊 的 要 求 。 在 Sun 公司 的 实现 中 ， 对 
object 的 引用 是 一 个 句柄 ， 其 中 包含 一 对 指针 : 一 个 指针 指向 该 object 的 方法 表 ， 另 一 个 
指向 该 object 的 数据 。 用 Java 虚拟 机 的 字 节 码 表示 的 程序 应 该 遵守 类 型 规定 。Java 虚拟 机 
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的 实现 应 拒绝 执行 违反 了 类 型 规定 的 字 节 码 程序 。Java 虚拟 机 由 于 字 节 码 定义 的 限制 似乎 
只 能 运行 在 32 位 地 址 空间 的 机 器 上 。 但 是 可 以 创建 一 个 Java 虚拟 机 ， 它 自动 地 把 字 节 码 
转换 成 64 位 的 形式 。 从 Java 虚拟 机 支持 的 数据 类 型 可 以 看 出 ，Java 对 数据 类 型 的 内 部 格 
式 进行 了 严格 规定 ， 这 样 使 得 各 种 Java 虚拟 机 的 实现 对 数据 的 解释 是 相同 的 ， 从 而 保证 了 
Java 的 与 平台 无 关 性 和 可 移植 性 。 


1.5.4 ”Java 虚拟 机 体系 结构 


Java 虚拟 机 由 5 个 部 分 组 成 : 一 组 指令 集 、 一 组 寄存 器 、 一 个 栈 、 一 个 无 用 单元 收集 
堆 (Garbage-collected-heap) 和 一 个 方法 区 域 。 这 五 部 分 是 Java 虚拟 机 的 逻辑 成 分 ， 不 依赖 
任何 实现 技术 或 组 织 方式 ， 但 它们 的 功能 必须 在 真实 机 器 上 以 某 种 方式 实现 。 接 下 来 将 简 
要 介绍 上 述 组 成 部 分 的 基本 知识 ， 更 加 详细 的 内 容 请 参阅 本 书后 面 的 内 容 。 


1. Java 指令 集 


Java 虚拟 机 支持 大 约 248 个 字 节 码 ， 每 个 字 节 码 执行 一 种 基本 的 CPU 运算 ， 例 如 ， 
把 一 个 整数 加 到 寄存 器 、 子 程序 转移 等 。Java 指令 集 相 当 于 Java 程序 的 汇编 语言 。 

Java 指令 集中 的 指令 包含 一 个 单字 节 的 操作 符 ， 用 于 指定 要 执行 的 操作 ， 还 有 0 个 或 
多 个 操作 数 ， 提 供 操作 所 需 的 参数 或 数据 。 许 多 指令 没有 操作 数 ， 仅 由 一 个 单字 节 的 操作 
符 构成 。 

虚拟 机 内 层 循环 的 执行 过 程 如 下 : 

取 二 个 操作 符 字 节 ; 

根据 操作 符 的 值 执行 一 个 动作 ; 

}while (程序 未 结束 ) 

因为 指令 系统 的 简单 性 ， 所 以 使 得 虚拟 机 执行 的 过 程 十 分 简单 ， 这 样 有 利于 提高 执行 
的 效率 。 指 令 中 操作 数 的 数量 和 大 小 是 由 操作 符 决 定 的 。 如 果 操 作 数 比 一 个 字 节 大 ， 那 么 
它 的 存储 顺序 是 高 位 字 节 优先 。 假 如 一 个 16 位 的 参数 存放 时 占用 两 个 字 节 ， 其 值 为 : 

第 一 个 字 节 *256+ 第 二 个 字 节 

字 节 码 指 令 流 一 般 只 是 字 节 对 齐 的 ， 但 是 指令 tabltch 和 lookup 是 例外 ， 在 这 两 条 指 
令 内 部 强制 要 求 的 4 字 节 边界 对 齐 。 


2. 寄存 器 


Java 虚拟 机 的 寄存 器 用 于 保存 机 器 的 运行 状态 ， 与 微 处 理 器 中 的 某 些 专用 寄存 器 类 
似 ， 所 有 寄存 器 都 是 32 位 的 。 在 Java 虚拟 机 中 有 如 下 4 种 寄存 器 。 

口 “pc: Java 程序 计数 器 。 

DD optop: 指向 操作 数 栈 顶 端的 指针 。 

口 ”frame: 指向 当前 执行 方法 的 执行 环境 的 指针 。 

口 ”vars: 指向 当前 执行 方法 的 局 部 变量 区 第 一 个 变量 的 指针 。 

Java 虚拟 机 是 栈 式 的 ， 它 不 定义 或 使 用 寄存 器 来 传递 或 接受 参数 ， 其 目的 是 为 了 保证 
指令 集 的 简洁 性 和 实现 时 的 高 效 性 ， 特 别 是 对 于 寄存 器 数目 不 多 的 处 理 器 。 
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3. 栈 


Java 虚拟 机 中 的 栈 有 三 个 区 域 ， 分 别 是 局 部 变量 区 、 运 行 环 境 区 、 操 作 数 栈 区 。 
1) 局 部 变量 区 
每 个 Java 方法 使 用 一 个 固定 大 小 的 局 部 变量 集 。 它 们 按照 与 vars 寄存 器 的 字 偏 移 量 
来 寻 址 。 局 部 变量 都 是 32 位 的 。 长 整数 和 双 精 度 浮 点 数 占 据 了 两 个 局 部 变量 的 空间 ， 却 
按照 第 一 个 局 部 变量 的 索引 来 寻 址 (例如 : 一 个 具有 索引 n 的 局 部 变量 ， 如 果 是 一 个 双 精 度 
浮 点 数 ， 那 么 它 实际 占据 了 索引 n 和 n+l 所 代表 的 存储 空间 )。 虚 拟 机 规范 并 不 要 求 在 局 部 
变量 中 64 位 的 值 是 64 位 对 齐 的 。 虚 拟 机 提供 了 把 局 部 变量 中 的 值 装载 到 操作 数 栈 的 指 
令 ， 也 提供 了 把 操作 数 栈 中 的 值 写 入 局 部 变量 的 指令 。 
2) 运行 环境 区 
在 运行 环境 中 包含 的 信息 可 以 实现 动态 链接 、 正 常 的 方法 返回 、 异 常 和 错误 传播 。 
(1) 动态 链接 
运行 环境 包括 对 指向 当前 类 和 当前 方法 的 解释 器 符号 表 的 指针 ， 用 于 支持 方法 代码 的 
动态 链接 。 方 法 的 class 文件 代码 在 引用 要 调用 的 方法 和 要 访问 的 变量 时 使 用 符号 。 动 态 
链接 把 符号 形式 的 方法 调用 翻译 成 实际 方法 调用 ， 装 载 必 要 的 类 以 解释 还 没有 定义 的 符 
号 ， 并 把 变量 访问 翻译 成 与 这 些 变量 运行 时 的 存储 结构 相应 的 偏 移 地 址 。 动 态 链 接 方 法 和 
变量 使 得 方法 中 使 用 的 其 他 类 的 变化 不 会 影响 到 本 程序 的 代码 。 
(2) 正常 的 方法 返回 
如 果 当 前 方法 正常 地 结束 了 ， 在 执行 了 一 条 具有 正确 类 型 的 返回 指令 时 ， 调 用 的 方法 
会 得 到 一 个 返回 值 。 执 行 环境 在 正常 返回 的 情况 下 用 于 恢复 调用 者 的 寄存 器 ， 并 把 调用 者 
的 程序 计数 器 增加 一 个 恰当 的 数值 ， 以 跳 过 已 执行 过 的 方法 调用 指令 ， 然 后 在 调用 者 的 执 
行 环 境 中 继续 执行 下 去 。 
(3) 异常 和 错误 传播 
异常 情况 在 Java 中 被 称 作 Error( 错 误 ) 或 Exception( 异 常 )， 是 Throwable 类 的 子 类 ， 在 
程序 中 出 现 的 原因 有 以 下 两 点 : 
口 ”动态 链接 错 ， 如 无 法 找到 所 需 的 class 文件 。 
口 ”运行 时 出 错 ， 如 对 一 个 空 指针 的 引用 程序 使 用 了 throw 语句 。 当 发 生 异 常 时 ， 
Java 虚拟 机 采取 如 下 措施 解决 。 
> 检查 与 当前 方法 相 联 系 的 catch 子 句 表 。 每 个 catch 子 句 包含 其 有 效 指令 范 
围 、 能 够 处 理 的 异常 类 型 ， 以 及 处 理 异 常 的 代码 块 地 址 。 
> 与 异常 相 匹 配 的 catch 子 句 应 该 符合 下 面 的 条 件 : 造成 异常 的 指令 在 其 指令 范 
围 之 内 ， 发 生 的 异常 类 型 是 其 能 处 理 的 异常 类 型 的 子 类 型 。 如 果 找 到 了 匹配 的 
catch 子 句 ， 那 么 系统 转移 到 指定 的 异常 处 理 块 处 执行 。 如 果 没 有 找到 异常 处 
理 块 ， 会 重复 寻找 匹配 的 catch 子 句 的 过 程 ， 直 到 当前 方法 所 有 婴 套 的 catch 
子 句 都 被 检查 过 。 
> 由 于 虚拟 机 从 第 一 个 匹配 的 catch 子 句 处 继续 执行 ， 所 以 catch 子 句 表 中 的 顺 
序 是 很 重要 的 。 因 为 Java 代码 是 结构 化 的 ， 因 此 总 可 以 把 某 个 方法 的 所 有 异 
常 处 理 器 都 按 序 排列 到 一 个 表 中 ， 对 任意 可 能 的 程序 计数 器 的 值 ， 都 可 以 用 线 
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性 的 顺序 找到 合适 的 异常 处 理 块 ， 以 处 理 在 该 程序 计数 器 值 下 发 生 的 异常 
情况 。 
> 如 果 找 不 到 匹配 的 catch 子 句 ， 那 么 当前 方法 得 到 一 个 “未 截获 异常 ”的 结果 
并 返回 到 当前 方法 的 调用 者 ， 好 像 异 常 刚刚 在 其 调用 者 中 发 生 一 样 。 如 果 在 调 
用 者 中 仍然 没有 找到 相应 的 异常 处 理 块 ， 那 么 这 种 错误 传播 将 被 继续 下 去 。 如 
果 错 误 被 传播 到 最 顶层 ， 那 么 系统 将 调用 一 个 默认 的 异常 处 理 块 。 
3) 操作 数 栈 区 
机 器 指令 只 从 操作 数 栈 中 获取 操作 数 ， 对 它们 进行 操作 ， 并 把 结果 返回 到 栈 中 。 选 择 
栈 结构 的 原因 是 : 在 只 有 少量 寄存 器 或 非 通用 寄存 器 的 机 器 (如 Intel486) 上 ， 也 能 够 高 效 地 
模拟 虚拟 机 的 行为 。 操 作 数 栈 是 32 位 的 ， 它 用 于 给 方法 传递 参数 ， 并 从 方法 接收 结果 ， 
也 用 于 支持 操作 的 参数 ， 并 保存 操作 的 结果 。 例 如 ，iadd 指令 将 两 个 整数 相 加 ， 相 加 的 两 
个 整数 应 该 是 操作 数 栈 顶 的 两 个 字 。 这 两 个 字 是 由 先前 的 指令 压 进 堆栈 的 。 这 两 个 整数 将 
从 堆栈 弹出 、 相 加 ， 并 把 结果 压 回 到 操作 数 栈 中 。 
每 个 原始 数据 类 型 都 有 专门 的 指令 对 它们 进行 必需 的 操作 。 每 个 操作 数 在 栈 中 需要 一 
个 存储 位 置 ， 除 了 long 和 double 型 ， 它 们 需要 两 个 位 置 。 操 作 数 只 能 被 适用 于 其 类 型 的 
操作 符 所 操作 。 例 如 ， 压 入 两 个 int 类 型 的 数 ， 如 果 把 它们 当 作 是 一 个 long 类 型 的 数 则 是 
非法 的 。 在 Sun 的 虚拟 机 实现 中 ， 这 个 限制 由 字 节 码 验证 器 强制 实行 。 但 是 有 少数 操作 ( 操 
作 符 dupe 和 swap) 用 于 对 运行 时 数据 区 进行 操作 时 是 不 考虑 类 型 的 。 


4. 无 用 单元 收集 堆 


Java 的 堆 是 一 个 运行 时 数据 区 ， 类 的 实例 (对 象 ) 从 中 分 配 空间 。Java 语言 具有 无 用 单 
元 收集 能 力 ， 它 不 给 程序 员 显 示 释 放 对 象 的 能 力 。Java 不 规定 具体 使 用 的 无 用 单元 收集 算 
法 ， 可 以 根据 系统 的 需求 使 用 各 种 各 样 的 算法 。 

5. 方法 区 

方法 区 与 传统 语言 中 的 编译 后 代码 或 是 UNIX 进程 中 的 正文 段 类 似 。 它 保存 方法 代码 
(编译 后 的 Java 代码 ) 和 符号 表 。 在 当前 的 Java 实现 中 ， 方 法 代码 不 包括 在 无 用 单元 收集 堆 
中 ， 但 计划 在 将 来 的 版 本 中 实现 。 每 个 类 文件 包含 了 一 个 Java 类 或 一 个 Java 界面 编译 后 
的 代码 。 可 以 说 类 文件 是 Java 语言 的 执行 代码 文件 。 为 了 保证 类 文件 的 平台 无 关 性 ，Java 
虚拟 机 规范 中 对 类 文件 的 格式 也 做 了 详细 的 说 明 。 其 具体 细节 请 参考 Sun 公司 的 Java 虚拟 
机 规范 。 


1.5.5 “探索 Java 虚拟 机 家 族 成 员 的 发 展 史 


1996 年 ，Sun 发 布 了 一 个 虚拟 机 版 本 一 一 JDK 1.0， 其 中 所 包含 的 Sun Classic VM， 不 
知 不 觉 间 已 经 历 了 16 个 年 头 ， 在 这 16 年 间 涌 现 出 许多 杰出 的 虚拟 机 作品 ， 也 沽 灭 过 许多 
一 时 大 受 欢迎 的 虚拟 机 作品 。 下 面 将 和 读者 朋友 们 一 起 回顾 一 下 Java 虚拟 机 家 族 成 员 的 发 
展 历程 。 

1) 原始 鼻祖 一 一 Sun Classic/Exact VM 

1996 年 1 月 ，Sun 发布 了 JDK 1.0，JDK 1.0 中 的 虚拟 机 就 是 Classic VM。 这 款 虚拟 机 
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只 能 使 用 纯 解释 器 方式 来 执行 Java 代码 ， 如 果 要 使 用 JIT 编译 器 那 就 必须 进行 外 挂 ， 但 是 
假如 外 挂 了 JIT 编译 器 ，JIT 编译 器 就 完全 接管 了 虚拟 机 的 执行 系统 ， 解 释 器 便 不 再 工作 
了 。 如 果 在 这 款 虚拟 机 上 执行 如 下 命令 : 


java -version 


将 会 看 到 类 似 下 面 的 输出 : 

java version "1.2.2" 

Classic VM (build JDK-1.2.2-001, green threads, sunwjit) 

其 中 “sunwjit” 是 Sun 提供 的 外 挂 编译 器 ， 其 他 类 似 的 外 挂 编译 器 还 有 Symantec JIT 
和 shu JIT 等 。 由 于 解释 器 和 编译 器 不 能 配合 工作 ， 这 就 意味 着 如 果 要 使 用 编译 器 执行 ， 
编译 器 就 不 得 不 对 每 一 个 方法 ， 每 一 行 代码 都 进行 编译 ， 而 不 论 它们 执行 的 频率 是 否 具有 
编译 的 价值 。 基 于 程序 响应 时 间 的 压力 ， 这 些 编译 器 根本 不 敢 应 用 编译 耗 时 稍 高 的 优化 技 
术 ， 因 此 这 个 阶段 的 虚拟 机 即使 用 了 JIT 编译 器 输出 本 地 代码 ， 执 行 效率 和 “C/C++ 程序 也 
有 很 大 差距 。 所 以 ，Java 语言 被 扣 上 了 一 个 “很 慢 ” 的 帽子 。 

为 了 提升 Java 的 运行 效率 ， 在 Solaris 平台 上 为 JDK 1.2 发 布 了 一 款 名 为 Exact VM 的 
虚拟 机 。Exact VM 因 使 用 准确 式 内 存 管理 而 得 名 ， 即 虚拟 机 可 以 知道 内 存 中 某 个 位 置 的 数 
据 具体 是 什么 类 型 。 假 如 内 存 中 有 一 个 32bit 的 整数 123456， 它 到 底 是 一 个 reference 类 型 
指向 123456 的 内 存 地 址 ， 还 是 一 个 数值 为 123456 的 整数 ， 虚 拟 机 有 能 力 分 辨 出 来 ， 这 样 
才能 在 GC 的 时 候 准 确 判 断 堆 上 的 数据 是 否 还 可 能 被 使 用 。 由 于 使 用 了 准确 式 内 存 管理 ， 
Exact VM 可 以 抛弃 掉 以 前 Classic VM 基于 handler 的 对 象 查找 方式 ， 这 样 每 次 定位 对 象 都 
少 了 一 次 间接 查找 的 开销 ， 提 升 了 执行 性 能 。 

注意 : Exact VM 抛弃 Classic VM 基于 handler 对 象 查找 方式 的 原因 。 

原因 是 GC 后 对 象 将 可 能 会 被 移动 位 置 ， 如 果 地 址 为 123456 的 对 象 移动 到 654321， 
在 没有 明确 信息 表明 内 存 中 哪些 数据 是 reference 的 前 提 下 ， 那 虚拟 机 是 不 敢 把 内 存 中 所 有 
为 123456 的 值 改 成 654321 的 ， 所 以 要 使 用 句柄 来 保持 reference 值 的 稳定 。 

实话 实说 ，Exact VM 确实 比 Classic VM 快 ， 但 是 在 商业 应 用 上 很 快 就 被 更 为 优秀 
的 HotSpot VM 所 取代 。 与 之 形成 鲜明 对 比 的 是 ，Classic VM 的 生命 周期 反而 更 长 ， 在 
JDK 1.2 之前，Classic VM 是 Sun JDK 中 唯一 的 虚拟 机 。 并 且 在 JDK 1.2 时 ，Classic VM 
与 HotSpot VM 并 存 ， 但 默认 是 使 用 Classic VM( 可 以 使 用 “java -hotspot” 参 数 切换 至 
HotSpot VM)。 在 JDK 1.3 中 ，HotSpot VM 是 默认 虚拟 机 ， 它 仍 作为 虚拟 机 的 “备用 选 
择 ” 发 布 (可 以 使 用 “java -classic” 参 数 切换 )。 从 JDK 1.4 开始 ，Classic VM 才 正 式 退 出 
商用 虚拟 机 的 历史 舞台 ， 与 Exact VM 一 起 逐渐 淡出 了 我 们 的 视线 ， 默 默 无 闻 地 进入 了 
Sun Labs Research VM 之 中 。 

2) 帝国 斜阳 一 一 HotSpot VM 

HotSpot VM 是 Sun JDK 和 OpenJDK 中 所 带 的 虚拟 机 ， 因 为 是 目前 使 用 范围 最 广 的 
Java 虚拟 机 ， 所 以 被 广大 Java 程序 员 所 熟知 。HotSpot VM 最 初 是 由 Longview 
Technologies 公司 设计 的 ， 而 且 在 设计 之 初 并 非 是 为 Java 语言 而 开发 的 。Sun 在 1997 年 收 
购 了 Longview Technologies 公司 ， 从 而 获得 了 HotSpot VM。 

HotSpot VM 既 继承 了 Sun 之 前 两 款 商 用 虚拟 机 的 优点 ， 例 如 准确 式 内 存 管理 的 优 
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点 。 除 此 之 外 ， 也 具有 许多 自己 新 的 技术 优势 ， 例 如 名 称 中 的 HotSpot 指 的 就 是 它 的 热点 
代码 探测 技术 。HotSpot VM 的 热点 代码 探测 能 力 可 以 通过 执行 计数 器 找 出 最 具有 编译 价 
值 的 代码 ， 然 后 通知 JIT 编译 器 以 方法 为 单位 进行 编译 。 如 果 一 个 方法 被 频繁 调用 ， 或 方 
法 中 回 边 (是 指 程序 向 后 跳 转 的 行为 ) 次 数 很 多 ， 将 会 分 别 触发 标准 编译 和 OSR( 栈 上 蔡 换 ) 
编译 动作 。 通 过 编译 器 与 解释 器 恰当 地 协同 工作 ， 可 以 在 最 优化 的 程序 响应 时 间 与 最 佳 执 
行 性 能 中 取得 平衡 ， 而 且 无 需 等 待 本 地 代码 输出 才能 执行 程序 ， 即 时 编译 的 时 间 压 力也 相 
对 减 小 ， 这 样 有 助 于 引入 更 多 的 代码 优化 技术 ， 输 出 质量 更 高 的 本 地 代码 。 

2006 年 的 JavaOne 大 会 上 ，Sun 宣布 最 终 会 把 Java 开源 ， 并 在 随后 的 一 年 中 ， 陆 续 地 
将 JDK 的 各 个 部 分 (其 中 当然 也 包括 了 HotSpot VMD) 在 GPL 协议 下 公开 了 源码 ， 并 在 此 基 
础 上 建立 了 OpenJDK。 这 样 ，HotSpot VM 便 成 了 Sun JDK 和 OpenJDK 两 个 实现 极度 接近 
的 JDK 项 目的 共同 虚拟 机 。 

2008 年 和 2010 年 ，Oracle 分 别 收购 了 BEA 和 Sun 公司 ， 这 样 Oracle 就 同时 拥有 了 最 
优秀 的 两 款 Java 虚拟 机 : 要 ockit VM 和 HotSpot VM。Oracle 宣布 在 不 久 的 将 来 (大 约 应 在 
JDK 8 的 时 候 ) 会 完成 这 两 款 虚拟 机 的 整合 工作 ， 使 之 优势 互补 。 整 合 的 方式 大 致 上 是 在 
HotSpot 的 基础 上 ， 移 植 JRockit 的 优秀 特性 ， 辟 如 使 用 下 ockit 的 垃圾 回收 器 与 
MissionControl 服务 ， 使 用 HotSpot 的 JIT 编译 器 与 混合 的 运行 时 系统 。 

3) 为 特定 应 用 推出 的 产品 一 一 Mobile-Embedded VM / Meta-Circular VM 

除了 面向 服务 器 和 桌面 领域 的 商用 虚拟 机 外 ，Sun 公司 还 为 移动 和 舱 入 式 市 场 提供 了 
虚拟 机 产品 ， 并 且 为 研究 人 员 和 技术 人 员 推 出 了 专门 的 虚拟 机 产品 ， 这 些 虚拟 机 对 于 大 部 
分 不 从 事 相 关 和 领域 开发 的 Java 程序 员 来 说 可 能 比较 陌生 。Sun 公司 为 特定 应 用 推出 的 Java 
虚拟 机 产品 有 如 下 几 种 。 

(1) KVM 

KVM 中 的 K 是 Kilobyte 的 意思 ， 强 调 简单 、 轻 量 和 高 度 可 移植 性 ， 但 是 运行 速度 比 
较 慢 。 在 Androd、iOS 等 智能 手机 操作 系统 出 现 前 曾经 在 手机 平台 上 得 到 了 非常 广泛 的 
应 用 。 

(2) CDC/CLDC HotSpot 

CDC/CLDC 全 称 是 Connected(Limited)Device Configuration。 在 JSR-139/JSR-218 规范 
中 进行 定义 ，CDC/CLDC 希望 在 手机 、 电 子 书 、PDA 等 设备 上 建立 统一 的 Java 编程 接 
口 ， 而 CDC HotSpot VM 和 CLDC HotSpot VM 则 是 它们 的 一 组 参考 实现 。CDC/CLDC 是 
整个 Java ME 的 重要 支柱 ， 但 从 目前 Android 和 Apple iOS 二 分 天 下 的 移动 数字 设备 市 场 
看 来 ， 在 这 个 领域 中 ，Sun 的 虚拟 机 所 面临 的 局 面 远 不 如 服务 器 和 桌面 领域 乐观 。 

(3) Squawk VM 

Squawk VM 是 由 Sun 开发 的 、 运 行 于 Sun SPOT( 一 种 手持 的 Wif 设备 ) 的 虚拟 机 ， 也 
曾经 运用 于 Java Card。 这 是 一 个 Java 代码 比重 很 高 的 嵌入 式 虚 拟 机 实现 ， 其 中 诸如 类 加 
载 器 、 字 节 码 验证 器 、 垃 圾 收集 器 、 解 释 器 、 编 译 器 和 线程 调度 都 是 Java 语言 本 身 所 完成 
的 ， 仅 仅 人 靠 C 语言 来 编写 设备 IO 和 必要 的 本 地 代码 。 

(4) JavaInJava 

JavalInJava 是 Sun 公司 1997 一 1998 年 间 所 研发 的 一 个 实验 室 性 质 的 虚拟 机 ， 从 名 字 就 
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可 以 看 出 ， 它 试图 以 Java 语言 来 实现 Java 语言 本 身 的 运行 环境 ， 既 所 谓 的 “元 循环 ” 
(Meta-Circular， 是 指使 用 语言 自身 来 实现 其 运行 环境 )。 它 必须 运行 在 另外 一 个 宿主 虚拟 机 
之 上 ， 内 部 没有 JIT 编译 器 ， 代 码 只 能 以 解释 模式 执行 。 在 上 世纪 末 主 流 Java 虚拟 机 都 未 
能 很 好 解决 性 能 问题 的 时 代 ， 开 发 这 种 项 目 ， 其 执行 速度 大 家 可 想 而 知 。 

(5) Maxine VM 

Maxine VM 和 上 面 的 JavaInJava 非常 相似 ， 它 也 是 一 个 几乎 全 部 以 Java 代码 实现 (只 
有 用 于 启动 JVM 的 加 载 器 使 用 C 语言 编写 ) 的 元 循环 Java 虚拟 机 。 这 个 项 目 于 2005 年 开 
始 ， 到 现在 仍然 在 发 展 之 中 ， 比 起 JavaInJava，Maxine VM 就 显得 “ 靠 谱 ” 很 多 ， 它 有 先 
进 的 JIT 编译 器 和 垃圾 收集 器 (但 没有 解释 器 )， 可 在 宿主 模式 或 独立 模式 下 执行 ， 其 执行 
效率 已 经 接近 了 HotSpot Client VM 的 水 平 。 

4) 其 他 厂家 的 产品 一 一 BEA JRockit/ IBM Jo VM 

除了 Sun 公司 开发 虚拟 机 产品 外 ， 还 有 很 多 知名 的 组 织 和 公司 也 开发 出 很 多 优秀 的 虚 
拟 机 产品 ， 其 中 最 著名 的 是 BEA 公司 的 依 ockit 和 IBM 公司 的 J9VM。 

(1) JRockit VM 

JRockit VM 是 BEA 公司 在 2002 年 从 Appeal Virtual Machines 公司 收购 获得 的 虚拟 
机 ， 曾 经 号 称 是 “世界 上 速度 最 快 的 Java 虚拟 机 ”。BEA 将 其 发 展 为 一 款 专 门 为 服务 器 
硬件 和 服务 端 应 用 场景 高 度 优化 的 虚拟 机 ， 由 于 专注 于 服务 端 应 用 ， 它 可 以 不 太 关注 于 程 
序 启动 速度 ， 因 此 要 ockit 内 部 不 包含 解析 器 实现 ， 全 部 代码 都 靠 即 时 编译 器 编译 后 执 
行 。 除 此 之 外 ，JRockit 的 垃圾 收集 器 和 MissionControl 服务 套件 等 部 分 的 实现 ， 在 众多 
Java 虚拟 机 中 也 一 直 处 于 领先 水 平 。 

(2) J9 VM 

J9 VM 并 不 是 IBM 公司 唯一 的 Java 虚拟 机 ， 只 是 目前 IBM 全 力 发 展 并 推广 的 Java 虚 
拟 机 。J9 只 是 内 部 开发 代号 ， 正 式 名 称 是 IBM Technology for Java Virtual Machine， 简 称 
IT4J。 因 为 这 个 名 字 太 掏 口 ， 普 及 程度 不 如 J9， 所 以 一 直 被 称 为 JI。J9 VM 最 初 是 由 IBM 
Ottawa 实验 室 一 个 SmallTalk 的 虚拟 机 扩展 而 来 的 ， 当 时 这 个 虚拟 机 有 一 个 bug 是 因为 8k 
值 定 义 错误 引起 ， 工 程 师 们 花 了 很 长 时 间 终 于 发 现 并 解决 了 这 个 错误 ， 此 后 这 个 版 本 的 虚 
拟 机 就 被 称 为 K8 了 ， 后 来 扩展 出 支持 Java 的 虚拟 机 就 被 称 为 J 了 。 与 BEA JRockit 专 注 
于 服务 端 应 用 不 同 ，IBM Joe 的 市 场 定 位 与 Sun HotSpot 比较 接近 ， 它 是 一 款 设计 上 从 服务 
端 到 桌面 应 用 再 到 嵌入 式 都 全 面 考虑 的 多 用 途 虚拟 机 ，Jo9 的 开发 目的 是 作为 IBM 公司 各 
种 Java 产品 的 执行 平台 ， 它 的 主要 市 场 在 和 IBM 产品 (如 IBM WebSphere 等 ) 搭 配 以 及 在 
IBM AIX 和 z/OS 这 些 平台 上 部 署 Java 应 用 。 


1.6 Java 的 最 大 优势 平台 无 关 性 


Java 体系 结构 通过 很 多 方面 提供 对 平台 无 关 性 的 支持 。 其 中 Java 平台 是 最 主要 的 方 
面 。Java 平台 扮演 了 一 个 运行 时 Java 程序 与 其 下 操作 系统 和 硬件 之 间 的 缓冲 角色 。 换 个 角 
度 看 ，Java 平台 实际 上 充当 了 一 个 标准 的 OS， 只 是 这 个 OS 目前 看 起 来 还 过 于 笨重 。Java 
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编程 语言 本 身 对 平台 无 关 性 也 提供 了 相应 的 支持 ， 但 是 这 是 建立 在 Java 平台 的 基础 上 的 。 
对 于 C/C++ 程序 员 来 说 ， 最 明显 的 一 个 例子 就 是 对 基本 数据 类 型 的 值 域 和 行为 的 定义 。 以 
前 我 们 一 直 强 调 不 同 的 平台 ， 不 同 的 机 器 ， 不 同 的 CPU 都 有 不 同 的 字 节 长 度 定义 ， 但 是 
在 Java 中 ， 已 经 不 存在 这 种 差别 了 ， 因 为 Java 语言 统一 了 这 些 。 至 于 究竟 实际 的 硬件 是 
怎么 工作 的 ， 对 于 Java 程序 员 来 说 ， 已 经 不 用 去 关心 了 。Java 平台 已 经 自动 地 完成 了 这 种 
转换 。 

另外 一 个 对 平台 无 关 性 提供 支持 的 方面 是 Java 的 Class 文件 格式 。 它 对 于 所 有 的 Java 
虚拟 机 都 是 标准 统一 的 ， 这 也 为 跨 平 台 传递 程序 代码 提供 了 实现 的 可 能 。 所 以 ， 总 体 上 来 
看 ，Java 体系 结构 对 平台 无 关 性 的 支持 ， 主 要 来 自 于 Java 平台 的 设计 ， 相 当 于 为 不 同 的 硬 
件 和 操作 系统 提供 了 一 层 标准 的 外 壳 ，Java 体系 结构 将 操作 建立 在 一 个 虚拟 的 平台 上 ， 也 
就 达到 了 平台 无 关 的 目的 ， 虽 然 同 时 也 带 来 了 很 多 的 缺点 。 但 是 这 种 趋势 是 不 可 阻挡 的 。 

说 到 平台 无 关 性 ， 不 可 忽略 的 是 Java 不 仅 在 计算 机 领域 实现 了 跨 平 台 ， 而 且 在 智能 设 
备 领域 也 实现 了 跨 平 台 。 这 是 通过 定义 不 同 的 虚拟 机 标准 来 实现 的 。 也 就 是 我 们 耳熟能详 
的 PEE、J2SE、J2ME。 实 际 上 ， 这 三 个 Java 版 本 就 是 在 不 同 的 智能 设备 上 的 虚拟 机 规 
范 。 而 在 ME 领域 ， 平 台 无 关 性 体现 得 就 更 明显 了 ， 因 为 移动 /嵌入 式 设备 的 厂商 和 标准 
都 比 计 算 机 领域 多 得 多 ， 统 一 的 难度 就 更 大 了 。 所 以 在 J2ME 领域 ， 除 了 有 J2ME 这 个 大 
框架 ， 还 针对 各 个 更 细小 的 领域 定义 了 各 自 的 虚拟 机 标准 ， 这 些 标准 被 称 作 profile。 

虽然 平台 无 关 性 看 起 来 是 那么 的 诱 人 ， 但 是 在 编写 Java 程序 的 时 候 ， 平 台 无 关 性 只 是 
一 个 选项 ， 并 不 是 一 个 必 选 项 。 从 根本 上 来 说 ， 任 何 Java 程序 的 平台 无 关 程 度 都 依赖 于 作 
者 怎么 编写 它 。 有 如 下 6 个 因素 会 影响 平台 无 关 性 。 

1) Java 平台 的 部 署 

Java 平台 的 平台 无 关 性 决定 了 要 运行 Java 程序 就 必须 要 在 客户 机 上 安装 符合 客户 操作 
系统 的 Java 平台 ， 也 就 是 Java 虚拟 机 。 这 并 不 是 每 一 台 计 算 机 每 一 种 操作 系统 都 能 满足 
的 条 件 。 但 是 幸运 的 是 Java 已 经 得 到 了 广泛 的 推广 ， 所 以 这 个 问题 在 大 部 分 客户 那里 已 经 
得 到 了 解决 。 

2) Java 平台 的 版 本 

这 个 问题 主要 集中 在 Java 不 同 版 本 的 Java API 上 。 虽 然 Java 平台 比较 稳定 ， 但 是 
Java API 的 改动 是 比较 频繁 的 ， 这 种 改动 会 导致 新 版 本 的 Java 程序 不 能 在 旧 平台 上 运行 ， 
这 也 是 开发 语言 的 通病 。 

3) 本 地 方法 

当 Java 要 用 到 一 些 操作 系统 平台 的 特性 ， 需 要 使 用 本 地 方法 的 时 候 ， 就 会 破坏 平台 无 
关 性 。Sun 一 直 在 大 力 推广 纯 Java 程序 ， 就 是 想 通 过 程序 员 的 努力 ， 尽 量 避 免 使 用 本 地 
方法 。 

4) 非 标准 运行 时 库 

虽然 本 地 方法 会 破坏 平台 无 关 性 ， 但 是 Java API 提供 的 标准 方法 中 使 用 的 本 地 方法 却 
不 在 其 列 。 在 标准 API 之 外 ， 还 有 一 些 厂商 和 组 织 提供 的 非 标 准 方法 ， 这 些 方 法 有 可 能 使 
用 了 本 地 方法 ， 却 不 是 任何 Java 平台 都 拥有 的 ， 所 以 对 于 这 种 非 标 准 方法 ， 一 定 要 谨慎 使 
用 ， 如 果 它 们 使 用 了 本 地 方法 来 实现 ， 那 么 平台 无 关 性 就 被 破坏 了 。 
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5) 对 虚拟 机 的 依赖 

在 分 析 Java 虚拟 机 的 时 候 ， 需 要 牢记 的 一 点 是 ， 虚 拟 机 不 过 是 Sun 提供 的 一 个 文字 标 
准 ， 并 不 是 具体 的 实现 ， 我 们 平时 用 的 虚拟 机 是 Sun 提供 的 ， 但 是 这 并 不 是 标准 的 虚拟 机 
实现 ， 实 际 上 虚拟 机 并 没有 标准 的 实现 ， 唯 一 的 标准 就 是 Sun 给 出 的 那 份 标准 。 所 以 对 于 
虚拟 机 标准 提供 的 一 些 特性 ， 千 万 不 能 作为 程序 逻辑 的 一 部 分 。 因 为 标准 只 是 指出 一 定 要 
实现 这 些 特 性 ， 但 是 具体 怎么 实现 ， 是 由 具体 的 虚拟 机 实现 决定 的 。 一 些 可 以 举例 的 特性 
是 垃圾 回收 机 制 、 线 程 优先 级 等 。 它 们 被 实现 了 ， 但 是 并 没有 一 个 确定 的 实现 方式 ， 比 如 
垃圾 回收 的 时 机 ， 线 程 优先 级 高 低 是 否 一 定 决定 了 CPU 时 间 分 配 的 多 少 等 。 

6) 对 用 户 界面 的 依赖 

在 不 同 的 Java 平台 上 ， 要 保证 每 个 平台 的 UI 都 让 用 户 满意 是 很 困难 的 事情 。 所 以 在 
跨 平台 设计 的 时 候 ， 要 谨慎 地 设计 UI 的 接口 ， 以 保证 在 每 个 平台 上 都 有 令 人 满意 的 
表现 。 


1.6.1 平台 无 关 性 的 好 处 


Java 平台 无 关 性 的 最 大 好 处 是 ， 使 用 开发 的 软件 产品 ， 不 需 改 动 代码 或 只 做 很 小 的 更 
改 就 能 在 任何 主流 的 平台 上 运行 ， 给 公司 节约 很 大 的 开发 成 本 。 无 论 是 在 网 络 应 用 方面 ， 
在 嵌入 式 应 用 方面 ， 还 是 对 开发 人 员 来 说 ，Java 的 平台 无 关 性 都 给 用 户 带 来 了 巨大 的 
好 处 。 


1. 网 络 应 用 


Java 技术 在 网 络 环境 下 非常 有 用 ， 这 是 因为 用 Java 创建 的 可 执行 二 进 制 代码 能 够 不 加 
改变 地 运行 于 多 个 平台 。 这 一 点 在 网 络 化 环境 中 特别 重要 ， 因 为 大 多 数 网 络 通常 都 是 由 各 
种 各 样 不 同 种 类 的 计算 机 和 设备 互联 而 成 。 例 如 ， 网 络 上 可 能 链接 了 艺术 创作 部 门 的 
Macintosh 计算 机 、 工 程 部 门 的 UNIX 工作 站 以 及 随处 可 见 的 运行 Windows 的 PC。 尽 管 这 
种 情形 下 ， 公 司 内 部 的 各 种 计算 机 和 设备 可 以 共享 彼此 的 数据 ， 但 是 它 仍然 需要 大 量 的 管 
理工 作 。 像 这 样 一 个 网 络 ， 要 求 系统 管理 员 必 须 随 时 维持 运行 于 不 同 种 类 计算 机 上 的 同一 
个 程序 ， 在 更 新 的 时 候 要 根据 特定 于 它 所 运行 的 不 同 平台 进行 版 本 同步 更 新 。 如 果 程 序 能 
够 不 加 修改 地 运行 于 网 络 上 的 任何 计算 机 ， 而 不 管 该 计算 机 是 什么 种 类 ， 那 么 这 将 极 大 地 
减轻 系统 管理 员 的 工作 。 特 别 是 当 这 样 的 程序 是 通过 网 络 交付 的 时 候 ， 效 果 更 加 显著 。 


2. 媒 入 式 应 用 


很 多 网 络 化 嵌入 式 设 备 展示 了 Java 另 一 个 擅长 的 领域 。 例 如 ， 在 工作 场所 中 的 打印 
机 、 扫 描 仪 和 传真 机 等 嵌入 式 设备 ， 它 们 通常 都 连接 到 了 内 部 网 络 中 ， 像 这 样 连接 到 网 络 
的 嵌入 式 设备 ， 也 可 以 出 现在 消费 品 领域 ， 像 家 庭 网 络 和 汽车 等 。 在 嵌入 式 的 世界 中 
Java 的 平台 无 关 性 也 有 助 于 简化 系统 管理 任务 。 通 过 专用 于 给 网 络 带 来 即 插 即 用 功能 的 技 
术 ， 就 极 大 地 减少 了 在 网 络 互联 的 嵌入 式 设 备 环境 下 的 管理 任务 ， 不 管 是 对 在 家 里 的 消费 
者 还 是 在 工作 场所 的 系统 管理 员 都 一 样 。 一 旦 某 个 设备 加 入 到 这 样 的 网 络 中 ， 它 就 能 立即 
访问 网 络 上 的 其 他 设备 ， 同 样 其 他 的 设备 也 可 以 访问 它 。 为 了 达到 如 此 简单 易 用 的 连接 能 
力 ， 采 用 了 Jini 技术 的 设备 将 通过 网 络 彼此 交换 对 象 ， 要 是 没有 Java 对 平台 无 关 性 的 支 
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持 ， 这 绝对 不 可 能 做 到 。 
3. 开发 人 员 


对 于 开发 人 员 来 说 ，Java 能 够 减少 开发 和 在 多 个 平台 上 部 署 应 用 程序 的 成 本 和 时 间 。 
如 果 想 要 支持 多 个 平台 ， 相 对 于 得 到 的 回报 而 言 会 显得 成 本 过 于 高 晶 ， 所 以 当今 大 多 数 程 
序 都 只 能 支持 一 个 平台 。 但 是 因为 Java 能 减少 支持 多 个 平台 所 花 的 代价 ， 所 以 这 些 代价 对 
于 很 多 程序 来 说 是 合算 的 。 
对 于 软件 开发 者 来 说 ，Java 的 平台 无 关 性 既 有 有 利 的 一 面 ， 也 有 不 利 的 一 面 。 
口 有 利 的 一 面 : 如 果 正 在 开发 和 销售 的 某 个 软件 产品 ，Java 的 平台 无 关 性 有 助 于 商 
家 进入 到 更 多 的 市 场 ， 而 不 是 开发 一 个 仅 能 运行 于 Windows 的 程序 。 例 如 ， 可 以 
开发 一 个 能 同时 运行 于 Windows、OS/2、Solaris 和 Linux 的 程序 。 使 用 Java 可 以 
帮助 商家 拥有 更 多 的 潜在 客户 。 
口 不 利 的 一 面 : 别人 同样 也 能 这 么 做 。 假 如 你 正在 集中 精力 为 Solaris 开发 一 个 非常 
棒 的 软件 ，Java 却 让 其 他 人 更 容易 开发 出 类 似 的 软件 ， 并 和 你 在 同一 个 目标 市 场 
中 竞争 ， 在 使 用 Java 时 ， 不 能 只 看 到 它 带 来 更 多 潜在 客户 的 好 处 ， 同 样 它 也 带 来 
更 多 潜在 的 竞争 对 手 。 
在 程序 员 眼 中 ，Java 程序 具备 了 不 加 修改 便 可 以 运行 于 多 个 平台 的 能 力 ， 这 给 予 了 网 
络 一 个 同 构 的 运行 环境 。 这 就 使 得 新 的 分 布 系统 可 以 围绕 着 “网 络 移动 ”对 象 来 构建 。 


1.6.2 Java 对 平台 无 关 性 的 支持 


Java 为 了 支持 Java 程序 的 平台 无 关 性 ， 通 过 Java 平台 、Java 语言 、Java Class 文件 和 
可 伸缩 性 等 4 个 方面 进行 了 支持 。 
1. Java 平台 


Java 平台 扮演 了 一 个 运行 时 Java 程序 与 其 下 的 硬件 和 操作 系统 之 间 的 缓冲 角色 。Java 
程序 被 编译 为 可 运行 在 Java 虚拟 机 中 的 二 进 制 程序 ， 并 且 假 定 JavaAPI 的 Class 文件 在 运 
行 时 都 是 可 用 的 。 接 下 来 虚拟 机 运行 程序 ， 那 些 API 则 给 予 程序 访问 底层 计算 机 资源 的 能 
力 。 无 论 Java 程序 被 部 署 到 何 处 ， 它 只 需要 与 Java 平台 交互 ， 而 不 需要 担心 底层 的 硬件 
和 操作 系统 ， 所 以 它 就 能 够 运行 于 任何 拥有 Java 平台 的 计算 机 。 

2. Java 语言 的 支持 

Java 语言 的 基本 数据 类 型 的 值 域 和 行为 都 是 由 语言 自己 定义 的 。 而 在 C 语言 或 C++ 语 
言 中 ， 基 本 整数 类 型 int 的 值 域 是 由 它 的 占 位 宽度 决定 的 ， 而 它 的 占 位 宽度 则 由 目标 平台 
决定 。 一 般 来 说 ，C 或 C++ 中 int 的 占 位 宽度 是 由 编译 器 根据 目标 平台 的 字 长 来 决定 。 这 
就 意味 着 针对 不 同 平台 编译 的 同一 个 C++ 程序 在 运行 时 可 能 会 有 不 同 的 行为 ， 这 仅仅 是 因 
为 基本 数据 类 型 在 不 同 的 平台 上 值 域 不 同 。 但 是 对 于 Java 程序 来 说 ， 不 管 其 运行 的 平台 是 
什么 ，Java 中 的 int 都 是 32 位 二 进 制 补 码 表示 的 有 符号 整数 ， 而 float 则 总 是 遵守 IEEE754 
浮 点 标准 的 32 位 浮 点 数 。 并 且 这 一 点 在 Java 虚拟 机 内 部 以 及 Class 文件 中 都 是 一 致 的 。 
通过 确保 基本 数据 类 型 在 所 有 平台 上 的 一 致 性 ，Java 语言 本 身 为 Java 程序 的 平台 无 关 性 提 
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供 了 强 有 力 的 支持 。 
3. Java Class 文件 的 支持 


Java 的 Class 文件 定义 了 一 个 特定 于 Java 虚拟 机 的 二 进 制 格式 ， 此 文件 可 以 在 任何 平 
台 上 创建 ， 也 可 以 被 任何 平台 的 Java 虚拟 机 装 入 并 运行 。Class 文件 的 格式 都 有 严格 的 定 
义 ， 例 如 ， 多 字 节 值 的 高 位 优先 存放 约定 ， 并 且 与 Java 虚拟 机 所 在 平台 无 关 。 


4. 可 伸缩 性 


Java 支持 平台 无 关 性 ， 主 要 体现 在 它 的 可 伸缩 性 。Java 平台 可 以 在 各 种 不 同类 型 的 计 
算 机 上 实现 ， 无 论 是 嵌入 式 设备 还 是 大 型 主机 。 

虽然 Java 目前 在 Web 领域 和 桌面 领域 都 声明 卓著 ， 但 它 最 初 确实 是 被 期 望 用 于 嵌入 
式 设备 和 消费 电器 领域 的 ， 而 不 是 桌面 计算 机 。 这 样 的 设计 目标 ， 部 分 原因 是 由 于 ， 尽 管 
Microsoft 公司 和 Intel 公司 在 桌面 市 场 占 有 统治 地 位 ， 但 是 它们 在 嵌入 式 设备 和 消费 电器 
市 场 并 不 具备 这 种 优势 。 微 处 理 器 开始 越 来 越 多 地 出 现在 音频 视频 装备 、 蜂 窝 电 话 、 打 印 
机 、 传 真 机 、 复 印 机 等 设备 中 ， 而 这 些微 处 理 器 可 以 连接 到 网 络 。 因 而 ，Java 最 初 的 设计 
目标 之 一 就 是 提供 某 种 方式 ， 让 软件 可 以 通过 网 络 交付 到 任意 种 类 的 嵌入 式 设 备 中 一 一 不 
管 它 的 微 处 理 器 和 操作 系统 是 什么 。 

为 了 达到 这 个 目标 ，Java 运行 时 系统 (Java 平台 ) 不 得 不 设计 得 尽量 紧凑 ， 以 便 它 可 以 
使 用 能 入 式 系统 中 有 限 的 资源 以 软件 的 方式 来 实现 ， 媒 入 式微 处 理 器 通常 有 一 些 特殊 的 限 
制 ， 比 如 ， 很 少 的 内 存 、 没 有 磁盘 、 没 有 图 形 化 显示 ， 甚 至 根本 没有 显示 功能 。 这 样 的 限 
制 ， 也 就 意味 着 嵌入 式 设备 和 消费 品系 统 通常 没有 必要 ， 或 者 不 可 能 支持 所 有 的 
JavaAPI。 

针对 嵌入 式 和 消费 性 电器 设备 的 特殊 需求 ，Sun 创建 了 几 个 具体 的 Java 平台 ， 他 们 包 
含 更 少 的 API。 

口 “Java 个 人 版 平台 ， 用 于 消费 性 电器 设备 。 

口 ”Java 嵌入 式 平台 ， 用 于 嵌入 式 系统 。 

口 Java 卡 平台 ， 用 于 智能 卡 。 

上 述 Java 平台 是 由 Java 虚拟 机 和 比 标准 的 Java 平台 更 小 的 运行 时 库 组 成 的 。 由 此 可 
见 ， 个 人 版 平台 和 标准 版 平台 的 区 别 是 : 前 者 比 后 者 提供 的 JavaAPI 运行 时 库 内 容 更 少 ， 
而 嵌入 式 平台 则 比 个 人 版 平台 还 要 少 。 虽 然 上 述 Java 平台 依次 面向 更 小 的 执行 环境 ， 并 且 
在 资源 利用 上 有 更 严格 的 限制 ， 但 是 他 们 所 提供 的 API 之 间 并 非 是 简单 的 子 集 关 系 。 每 一 
个 平台 提供 的 API 子 集 都 是 面向 一 个 特定 的 目标 领域 ， 因 此 ， 也 包含 专门 针对 该 目标 领域 
的 API。 

因为 Java 平台 很 紧凑 ， 所 以 可 以 在 很 多 嵌入 式 系 统 和 消费 性 电器 中 实现 。Java 平台 蕴 
含 的 紧凑 性 并 没有 把 实现 限制 在 很 小 的 范围 。Java 平台 可 以 在 个 人 计算 机 、 工 作 站 和 大 型 
机 上 保持 伸缩 性 。 虽 然 在 Java 开始 的 几 年 里 ，Java 虚拟 机 在 服务 器 端 遇 到 过 伸缩 性 的 困 
难 ， 但 是 虚拟 机 现在 已 经 针对 服务 器 做 过 优化 ， 很 多 实现 可 以 在 服务 器 端 得 到 非常 好 的 性 
能 。 在 这 个 方面 ，Sun 定义 了 一 个 API 超 集 一 一 J2EE， 后 来 升级 为 JavaEE。 除 了 标准 的 
JavaAPI 之 外 ，JavaEE 还 包含 了 在 企业 服务 环境 中 非常 有 用 的 一 些 技 术 ， 例 如 ，Servlet 和 
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最 终 Sun 改变 过 的 API 定义 方式 保留 了 三 个 基础 API 集合 ， 他 们 实现 了 Java 平台 不 
同 的 伸缩 性 : 

口 “ 企 业 版 PEE， 后 来 升级 为 JavaEE。 

口 标准 版 J2SE。 

口 ”微型 版 J2ME。 

在 高 端 应 用 领域 ， 企 业 版 的 存在 表明 了 Java 平台 在 高 端 服务 的 可 用 性 。 在 中 端 应 用 领 
域 ， 标 准 版 提供 了 在 浏览 器 中 启动 传统 applet 的 功能 和 桌面 环境 下 的 Java 平台 。 在 低 端 应 
用 领域 ， 微 型 版 通过 不 同 的 行业 子 集 ， 显 示 了 Java 平台 可 以 向 下 伸缩 ， 并 改变 自己 以 适应 
完全 不 同 的 消费 性 电器 市 场 和 嵌入 式 系统 需求 的 能 力 。 

进入 2012 年 之 后 ，Java 在 嵌入 式 的 地 位 稳步 提升 ， 例 如 ， 很 火 的 Android 应 用 开发 ， 
默认 的 语言 就 是 Java。 


1.6.3 “分析 影响 Java 平台 无 关 性 的 因素 


Java 的 体系 结构 不 仅 有 利于 创建 平台 无 关 性 软件 ， 而 且 可 以 快速 地 创建 和 平台 相关 的 
软件 。 当 编写 Java 应 用 程序 时 ， 平 台 无 关 性 只 是 一 个 可 选 的 性 能 。 影 响 Java 程序 平台 无 
关 性 的 因素 有 很 多 ， 主 要 有 Java 平台 的 部 署 、Java 平台 的 版 本 、 本 地 方法 、 非 标准 运行 时 
库 、 对 虚拟 机 的 依赖 、 对 用 户 界面 的 依赖 、Java 平台 实现 中 的 bug 和 测试 等 。 在 上 述 因 素 
中 ， 其 中 有 一 些 因素 不 在 开发 人 员 的 控制 范围 之 内 ， 但 是 大 多 数 是 由 开发 人 员 来 控制 的 。 
从 根本 上 说 ， 任 何 Java 程序 的 平台 无 关 程 度 都 依赖 于 作者 怎样 编写 它 。 


1. Java 平台 部 署 因素 


Java 平台 在 不 同 的 平台 上 被 部 署 的 程度 是 决定 Java 程序 平台 无 关 性 的 主要 因素 。 因 为 
只 有 在 拥有 Java 平台 的 计算 机 或 设备 上 才能 运行 Java 程序 ， 所 以 要 想 在 一 台 特 定 的 计算 
机 上 运 支行 自己 编写 的 Java 程序 时 ， 则 必须 将 Java 平台 移植 到 拥有 特定 类 型 的 硬件 和 操作 
系统 之 上 。 假 设 某 些 Java 平台 的 开发 商 已 经 完成 了 移植 的 实现 ， 那 么 这 个 实现 接口 还 必须 
用 某 种 方法 安装 到 我 们 的 计算 机 上 。 因 此 决定 Java 程序 平台 无 关 性 真正 程度 的 一 个 重要 
因素 一 一 这 个 因素 一 般 不 是 由 开发 人 员 控 制 的 一 一 就 是 已 有 了 可 用 的 Java 平台 实现 和 发 布 
版 本 。 

对 于 Java 开发 人 员 来 说 ，Java 平台 的 部 署 因 其 广泛 的 需求 性 已 得 到 推广 。 无 论 是 
Web 浏览 器 ， 还 是 桌面 计算 机 、 工 作 站 、 网 络 操作 系统 和 嵌入 式 设备 ， 它 们 都 需要 Java 平 
台 。 所 以 我 们 非常 有 可 能 已 经 在 自己 的 计算 机 或 设备 上 拥有 了 Java 平台 的 实现 。 

2. Java 平台 版 本 因素 

Java 平台 中 保证 可 用 的 基本 库 集合 被 称 为 标准 API。Sun 把 Java 虚拟 机 以 及 组 成 标准 
API 的 那些 Class 文件 成 为 Java 平台 标准 版 。 这 个 版 本 的 Java 平台 是 JavaAPI 库 的 最 小 集 
合 ， 例 如 ， 可 以 在 普通 桌面 电脑 和 工作 站 上 使 用 。Sun 同时 也 定义 了 Java2 平台 的 微型 版 
和 企业 版 ， 并 鼓励 在 各 种 消费 电器 和 嵌入 式 设 备 行业 开发 API 子 集 以 加 强 微型 版 。 除 此 之 
外 ，Sun 还 定义 了 一 些 标准 运行 时 库 ， 它 把 这 些 库 作为 标准 版 的 可 选项 ， 把 它们 策划 成 为 
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标准 扩展 API。 这 些 库 包括 一 些 如 电话 、 商 业 性 的 服务 ， 并 且 还 包括 诸如 音频 、 视 频 或 3D 
类 的 多 媒体 服务 。 如 果 在 程序 中 使 用 了 标准 扩展 API 中 的 库 ， 它 可 以 在 任何 支持 标准 扩展 
API 的 地 方 运行 ， 但 是 不 能 在 一 个 只 安装 了 最 基本 的 标准 平台 的 计算 机 上 运行 。 除 此 之 
外 ， 一 些 标准 扩展 API 在 企业 版 的 任何 实现 中 都 保证 可 用 ， 有 了 这 个 API 的 版 本 以 及 协 
议 ，Java2 平台 就 不 能 只 代表 一 个 同 构 的 执行 环境 了 一 一 同 构 的 执行 环境 可 以 使 一 段 代 码 
一 次 编写 多 处 运行 。 

在 某 种 意义 上 ，Java 平台 是 随 着 时 间 而 不 断 发 展 的 。 虽 然 Java 虚拟 机 发 展 得 非常 组 
慢 ， 但 是 Java API 会 非常 频繁 地 被 改动 。 随 着 时 间 的 推移 ， 不 论 是 标准 版 还 是 标准 扩展 
API， 都 将 加 入 或 删 减 某 些 特性 ， 甚 至 标准 扩展 API 中 的 一 部 分 可 能 会 移植 到 标准 版 中 。 
在 改动 Java 平台 时 ， 大 部 分 都 必须 是 向 上 兼容 的 ， 这 就 意味 着 它们 不 能 破坏 已 有 的 Java 
程序 ， 但 是 有 些 改动 也 未 必 一 定 要 这 样 。 例 如 : 有 些 过 时 的 特性 已 在 新 版 本 的 Java 平台 中 
删除 ， 一 些 已 存在 的 特性 的 程序 将 不 能 在 新 版 本 中 运行 ， 而 且 改动 也 可 能 不 向 下 兼容 ， 这 
样 针 对 Java 平台 新 版 本 而 编写 的 程序 就 不 一 定 能 在 老 版 本 中 运行 。 

Java 平台 的 动态 特性 在 一 定 程度 上 使 事情 变 得 复杂 ， 因 为 开发 人 员 希 望 能 够 只 写 一 个 程 
序 就 可 以 在 任何 计算 机 上 运行 。 在 理论 上 ， 只 要 程序 仅仅 依赖 于 标准 API 的 运行 时 库 ， 那 
么 程序 就 应 该 可 以 在 有 Java2 平台 标准 版 的 所 有 计算 机 上 运行 。 但 实际 上 ， 标 准 API 的 新 版 
本 要 过 一 段 时 间 才 能 在 任何 地 方 都 适用 。 当 程序 依赖 于 标准 API 最 新 版 本 的 一 些 特性 时 ， 
有 些 主机 可 能 不 能 运行 这 个 程序 ， 因 为 他 们 只 有 比较 老 的 版 本 ， 这 对 于 软件 开发 人 员 来 说 
已 不 是 一 个 新 问题 ， 例 如 ， 为 Windows 7 编写 的 程序 ， 不 能 在 以 前 的 操作 系统 Windows XP 
中 工作 ， 但 是 因为 Java 实现 了 软件 的 网 络 分 发 ， 这 个 问题 就 更 加 尖锐 了 。Java 的 好 处 不 仅 
在 于 它 可 以 方便 地 使 程序 从 一 个 平台 移植 到 另 一 个 平台 ， 而 且 可 以 使 同一 段 二 进 制 Java 代 
码 通过 网 络 发 送 ， 并 且 可 以 在 任何 计算 机 或 设备 上 运行 。 

作为 开发 人 员 来 说 ， 虽 然 我 们 不 能 控制 Java 平台 版 本 的 发 布 周 期 或 者 部 署 进度 ， 但 是 
可 以 为 自己 的 程序 选择 所 依赖 的 Java 平台 版 本 。 当 官方 发 布 一 个 新 的 Java 平台 版 本 时 ， 
我 们 必须 自行 确定 基于 哪 一 个 版 本 来 编写 程序 代码 。 


3. 本 地 方法 


是 否 调用 了 本 地 方法 是 决定 Java 程序 的 平台 无 关 程度 的 一 个 主要 因素 。 当 编写 一 个 平 
台独 立 的 Java 程序 时 ， 必 须 遵 守 的 一 条 最 重要 的 原则 就 是 : 不 要 直接 或 间接 调用 不 属于 
Java API 的 本 地 方法 ， 调 用 Java API 以 外 的 本 地 方法 将 使 程序 平台 相关 。 

在 不 需要 平台 无 关 性 的 情况 下 ， 可 以 直接 调用 本 地 方法 。 通 常 在 以 下 三 种 情况 下 适用 
本 地 方法 。 

口 ” 为 了 使 用 底层 的 主机 平台 的 某 个 特性 ， 而 这 个 特性 不 能 通过 Java API 访问 。 

口 为 了 访问 一 个 老 的 系统 或 者 使 用 一 个 已 有 的 库 ， 而 这 个 系统 或 库 不 是 用 Java 编 

写 的 。 

口 ” 为 了 加 快 程序 的 性 能 ， 而 将 一 段 时 间 敏感 的 代码 作为 本 地 方法 实现 。 

如 果 必须 使 用 本 地 方法 ， 而 且 要 使 程序 可 以 在 多 种 平台 上 运行 ， 那 么 必须 将 本 地 方法 
移植 到 所 有 需要 的 平台 上 。 这 种 移植 必须 用 传统 的 方法 实现 ， 而 一 旦 完成 了 移植 ， 必 须 说 
明 怎 样 将 这 个 平台 相关 的 本 地 方法 库 分 发 到 合适 的 主机 。 因 为 Java 体系 结构 的 设计 目的 是 
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简化 多 平台 的 支持 ， 所 以 ， 编 写 平台 独立 的 Java 程序 的 最 初 目的 是 要 完全 禁止 本 地 方法 ， 
并 且 应 该 仅 通过 Java API 和 主机 交互 。 

4. 非 标准 运行 时 库 

本 地 方法 和 平台 无 关 性 不 相 容 ， 平 台 无 关 性 的 任务 是 保证 方法 在 “任何 地 方 ” 都 已 实 
现 ， 例 如 ，Java API 可 以 同时 在 如 Windows 或 Linux 等 操作 系统 上 使 用 本 地 方法 来 访问 主 
机 。 当 调用 了 Java API 中 的 一 个 方法 时 ， 可 以 确保 它 在 任何 地 方 都 是 可 用 的 。 而 这 个 方法 
在 某 些 地 方 是 否 是 用 本 地 方法 实现 的 这 个 问题 是 无 关 紧 要 的 。 

Java 平台 可 以 由 许多 开发 商 来 实现 ， 虽 然 每 个 开发 商 必 须 提 供 Java API 的 标准 运行 时 
库 ， 但 是 有 极 个 别 开 发 商 提供 了 另外 的 库 。 如 果 在 开发 时 侧重 于 平台 无 关 性 ， 那 么 就 必须 
清楚 地 知道 所 使 用 的 那些 非 标准 运行 时 库 是 否 调用 了 本 地 方法 。 如 果 没 有 调用 本 地 方法 的 
非 标准 库 ， 就 不 会 降低 程序 的 平台 无 关 性 。 如 果 使 用 了 调用 本 地 方法 的 运行 时 库 ， 那 么 就 
会 产生 和 直接 调用 本 地 方法 一 样 的 结果 ， 使 得 程序 和 平台 相关 了 。 


5. 对 虚拟 机 的 依赖 


在 编写 平台 独立 的 Java 程序 时 ， 还 必须 遵循 以 下 两 条 原则 。 

(1) 不 要 依赖 及 时 终结 (Finalization) 来 达到 程序 的 正确 性 。 

(2) 不 要 依赖 线程 的 优先 级 (Thread Prioritization) 来 达到 程序 的 正确 性 。 

上 述 两 条 原则 和 Java 虚拟 机 中 的 某 些 部 分 有 关 ，Java 虚拟 机 中 的 某 些 部 分 可 以 由 不 同 
的 开发 商用 不 同 的 方法 实现 。 通 过 这 两 条 原则 ， 可 以 防止 垃圾 收集 和 线程 在 不 同 实现 中 的 
变化 所 带 来 的 不 利 影响 。 

为 了 保证 效率 ， 所 有 的 Java 虚拟 机 都 必须 有 垃圾 收集 器 ， 但 是 不 同 的 实现 可 能 使 用 不 
同 的 垃圾 收集 技术 。 在 Java 虚拟 机 的 规范 中 这 个 灵活 性 意味 着 ， 在 不 同 的 虚拟 机 中 ， 一 个 
特定 的 Java 程序 中 的 对 象 可 能 在 不 同 的 时 间 被 垃圾 收集 。 这 也 就 意味 着 那些 在 对 象 被 释放 
以 前 由 垃圾 收集 器 运行 的 终结 方法 ， 在 不 同 的 虚拟 机 中 可 能 是 在 不 同 的 时 间 运 行 的 。 如 果 
使 用 了 一 个 终结 方法 来 释放 有 限 的 内 存 资 源 ， 例 如 ， 文 件 句 柄 ， 程 序 就 可 能 可 以 在 一 些 虚 
拟 机 的 实现 上 运行 ， 而 在 其 他 实现 上 却 不 能 。 在 一 些 实现 上 ， 程 序 可 能 在 垃圾 收集 器 得 到 
机 会 调用 释放 资源 的 终结 方法 之 前 ， 就 已 经 将 有 限 的 资源 耗 尽 了 。 

在 不 同 Java 虚拟 机 的 实现 中 ， 另 一 个 变化 和 线程 的 优先 级 有 关 。Java 虚拟 机 规范 只 保 
证 了 程序 中 拥有 最 高 优先 级 的 可 运行 线程 会 得 到 一 些 CPU 时 间 。 这 个 规范 也 保证 了 在 较 
高 优先 级 的 线程 被 阻塞 时 ， 较 低 优先 级 的 线程 将 会 运行 。 但 是 ， 在 较 高 优先 级 的 线程 没有 
被 阻塞 的 情况 下 ， 并 没有 禁止 较 低 优先 级 的 线程 的 运行 。 在 某 些 虚拟 机 的 实现 中 ， 即 使 较 
高 优先 级 的 线程 未 被 阻塞 ， 那 些 较 低 优先 级 的 线程 也 可 能 得 到 CPU 时 间 。 如 果 你 的 程序 
依赖 于 这 个 行为 的 正确 性 ， 它 将 在 某 些 虚拟 机 的 实现 上 可 以 正常 运行 ， 而 在 某 些 实现 上 却 
不 能 。 为 了 保证 多 线程 程序 的 平台 独立 性 ， 必 须 依 赖 同步 而 不 是 优先 级 来 在 线程 间 协 调 相 
互 间 的 动作 。 


6. Java 平台 实现 中 的 bug 
在 Java 平台 的 不 同 实现 之 间 ，bug 是 其 中 的 一 个 主要 变化 因素 。 虽 然 Sun 已 经 开发 出 
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了 一 套 全 面 的 测试 标准 ， 但 是 Java 平台 的 实现 必须 通过 这 套 测试 。 但 是 问题 是 ， 可 能 其 中 
的 某 些 实现 在 发 布 时 仍然 包含 bug， 此 时 就 只 能 通过 测试 来 防止 这 种 可 能 性 。 通 过 bug 的 
存在 ， 可 以 通过 测试 来 确定 这 个 bug 是 否 影响 到 你 的 程序 ， 如 果 影 响 则 必须 试图 找到 一 个 
绕 开 的 途径 。 


7. 测试 


因为 在 不 同 Java 平台 的 实现 之 间 会 存在 差异 ， 所 以 当 依赖 某 些 特定 平台 写 的 Java 程 
序 时 ， 以 及 在 任何 特定 的 Java 平台 的 实现 中 都 可 能 有 bug 存在 ， 所 以 应 该 尽 可 能 在 所 有 和 希 
望 运行 的 平台 上 测试 Java 程序 。 就 当前 现实 情况 来 说 ，Java 程序 的 平台 无 关 性 并 没有 达到 
只 需要 在 一 个 平台 上 测试 成 功 ， 就 表明 可 以 运行 于 其 他 平台 的 能 力 。 我 们 仍然 需要 在 其 他 
平台 上 测试 Java 程序 ， 而 且 应 该 在 程序 运行 的 主机 上 尽 可 能 找到 所 有 的 Java 平台 的 不 同 
实现 ， 在 这 些 实现 上 都 对 程序 进行 测试 。 所 以 在 实际 情况 中 ， 在 程序 要 运行 的 不 同 主机 和 
不 同 Java 平台 实现 上 测试 你 的 Java 程序 ， 是 程序 平台 无 关 性 的 一 个 关键 因素 。 


1.6.4 ”实现 平台 无 关 性 的 策略 


Java 的 体系 结构 允许 开发 人 员 在 平台 无 关 性 和 其 他 考虑 之 间 进 行 选择 。 在 编写 程序 
时 ， 通 过 选择 所 使 用 的 方法 进行 选择 。 如 果 目 的 是 使 用 那些 平台 的 相关 特性 和 一 个 老 系统 
进行 交互 ， 或 使 用 一 个 不 是 用 Java 编写 的 现 有 的 库 ， 或 者 得 到 程序 的 最 快 执行 速度 ， 那 么 
可 以 使 用 本 地 方法 来 达到 此 目的 。 在 这 时 程序 的 平台 无 关 性 将 会 降低 ， 并 且 是 可 以 接受 
的 。 相 反 ， 如 果 目 的 是 考虑 平台 无 关 性 ， 那 么 在 编写 程序 时 需要 遵循 一 定 的 规则 。 下 面 列 
出 了 实现 程序 最 佳 可 移植 性 的 7 个 步骤 。 

(1) 选择 程序 要 运行 的 主机 和 设备 的 集合 ， 也 就 是 “目标 宿主 机 ”。 

(2) 在 目标 宿主 机 中 选择 自 认 为 足够 好 的 Java 平台 版 本 ， 在 该 版 本 Java 平台 上 编写 、 
运行 程序 。 

(3) 为 每 个 目标 宿主 机 选择 一 些 程序 将 要 运行 的 Java 平台 实现 。 

(4) 编写 程序 ， 使 其 只 通过 Java API 的 标准 运行 时 库 来 访问 计算 机 。 不 要 调用 本 地 方 
法 ， 或 者 开发 商 专 有 的 那些 调用 本 地 方法 的 库 。 

(5) 编写 程序 ， 使 它 不 依赖 垃圾 收集 器 及 时 终结 的 正确 性 ， 也 不 依赖 线程 的 优先 级 。 

(6) 努力 设计 一 个 用 户 界面 ， 使 它 在 你 所 有 的 目标 宿主 机 上 都 能 正常 工作 。 

(7) 在 所 有 的 目标 运行 时 环境 和 所 有 的 目标 宿主 机 上 测试 程序 。 

作为 一 个 开发 人 员 来 说 ， 当 思考 怎样 编写 某 个 特定 的 Java 程序 时 ， 软 件 工业 的 策略 和 
宣传 不 一 定 是 主要 的 考虑 因素 。 对 于 写 的 有 些 程序 ， 可 能 适合 平台 无 关 性 ;而 对 于 其 他 的 
一 些 ， 则 平台 相关 的 程序 可 能 会 更 有 意义 一 些 。 在 每 种 情况 下 ， 都 需要 作出 决定 ， 这 个 决 
定 要 基于 用 户 的 需要 ， 以 及 要 把 自己 放 在 市 场 的 什么 位 置 。 

如 果 遵 从 了 以 上 列 出 的 7 个 步骤 ， 那 么 Java 程序 将 肯定 可 以 在 你 所 有 的 目标 宿主 机 上 
运行 。 如 果 目 标 宿主 机 涉及 大 多 数 主要 的 Java 平台 的 开发 商 和 大 多 数 主要 类 型 的 计算 机 ， 
那么 很 有 可 能 我 们 的 程序 也 能 在 其 他 地 方 运行 。 
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”JDK 编译 测试 


想 要 深入 了 解 JDK 内 部 的 实现 机 制 ， 需 要 亲自 编译 一 套 JDK， 通 过 阅读 和 
跟踪 调试 JDK 源码 的 方式 可 以 更 好 地 了 解 Java 技术 体系 的 原理 。 并 且 在 JDK 
中 的 很 多 底层 方法 都 是 Nativel 本 地 ) 的 ， 当 需要 跟踪 这 些 方法 的 运作 或 对 JDK 
进行 Hack( 修 改 的 时 候 ， 都 需要 自己 编译 一 套 JDK。 本 章 将 详细 讲解 在 不 同 平 
台 下 编译 JDK 的 过 程 。 
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= 和 = 权衡 优化 、 高 效 和 安全 的 最 优 方 案 


2.1 为 什么 要 编译 JDK 


对 于 初学 者 来 说 ， 要 想 真 正 编译 JDK 的 话 ， 建 议 尽量 不 要 在 Windows 平台 编译 ， 
为 难度 比 在 Linux 平台 编译 要 高 不 少 。 哪 怕 读 者 们 没有 Linux 环境 ， 临 时 装 一 个 ubuntu， 
加 上 安装 操作 系统 的 时 间 都 比 直 接 在 Windows 下 编译 来 得 快 。 如 果 要 在 Windows 平台 编 
译 的 话 ， 看 看 是 否 需要 把 整个 JDK(HotSpot、Library、Utils( 如 VisualVM 等 )、JAXWS、 
etc) 都 编译 出 来 ， 相 信 大 部 分 人 只 想 要 一 个 虚拟 机 ， 那 可 以 关闭 掉 其 他 部 分 的 编译 ， 省 不 
少 事 。 所 以 接 下 来 将 遵循 先 易 后 难 的 原则 ， 分 别 讲解 在 Windows 平台 和 Linux 平台 编译 
JDK 的 知识 。 

在 当前 网 络 中 有 很 多 开源 JDK 可 以 供 我 们 选择 ， 例 如 Apache Harmony 和 OpenJDK 
等 。 因 为 当前 Sun 系列 的 JDK 是 使 用 得 最 广泛 的 JDK 版 本 ， 所 以 本 书 选 择 使 用 OpenJDK 
进行 编译 测试 。 


2.2 在 Windows 平台 编译 JDK 


在 本 节 的 内 容 中 ， 将 详细 地 讲解 在 Windows 平台 编译 JDK 的 基本 步骤 。 


2.2.1 为 什么 选择 OpenJDK 


在 众多 JDK 版 本 中 ， 最 合适 作为 编译 的 是 OpenJDK， 主 要 原因 如 下 。 

(1) OpenJDK 的 核心 代码 与 同时 期 Sun(Oracle) 的 产品 版 基本 上 是 一 样 的 ， 血 统 纯正 ， 
不 用 担心 性 能 问题 ， 也 基本 上 没什么 兼容 性 问题 。 代 码 上 最 主要 的 差异 是 在 原本 JDK 依赖 
的 第 三 方 库 上 ， 包 括 加 密 库 、 音 频 库 、 字 体 等 。 核 心 部 分 ， 也 就 是 HotSpot VM 与 Java 核 
心 库 基本 上 保持 了 Sun JDK 的 原貌 ， 甚 至 比 Sun JDK 还 更 快 地 吸收 了 社区 反馈 的 贡献 。 

(2) OpenJDK 是 真正 开源 的 ， 许 可 证 是 GPLv2+CE， 使 用 上 比 原本 JDK 的 另外 两 种 许 
可 证 要 自由 一 些 。 

(3) OpenJDK 的 构建 系统 比 原本 的 JDK 有 大 幅 改 进 ， 使 整个 build 过 程 变 得 非常 轻松 。 

OpenJDK 最 新 的 两 个 版 本 是 OpenJDK 6 和 OpenJDK 7， 两 者 都 是 开源 的 ， 源 码 都 可 
以 在 http://openjdk.java.net/ 下 载 获 得 。 其 实 OpenJDK 6 的 源码 是 从 OpenJDK 7 的 某 个 基线 
中 引出 的 ， 然 后 剥离 掉 JDK 1.7 相关 的 代码 ， 从 而 得 到 一 份 可 以 通过 TCK 6 的 JDK 1.6 实 
现 。 由 此 可 见 ， 直 接 编译 OpenJDK 7 会 更 加 “ 原 汁 原味 ”一 些 。 


2.2.2 获取 JDK 源码 


有 以 下 两 种 获取 OpenJDK 7 源码 的 方法 。 
(1) 使 用 Mercurial 代码 版 本 管理 工具 从 Repository 中 直接 取得 源码 ，Repository 的 地 
址 是 http://hg.openjdk.java.net/jdk7/jdk7j。 
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这 是 一 种 最 直接 的 方法 ， 源 码 可 以 比较 直观 地 展现 在 我 们 眼前 。 但 是 这 种 方法 的 缺点 
是 麻烦 ， 因 为 Mercurial 远 不 如 SVN、ClearCase 或 CVS 之 类 的 版 本 控制 工具 那样 普及 。 

(2) 直接 下 载 官方 打包 好 的 源码 包 ， 可 以 从 http://download.java.net/openjdk/jdk7/ 的 
Source Releases 页 面 取 得 打包 好 的 源码 ， 如 图 2-1 所 示 。 


吕 java.net The Source for Java Technology Collaboration 


My pages | Projects | Communities IE 
一 一 OpenJDK™ Source Releases 

June 27, 2011 

Build b147 


These are the source downloads for the OpenJOK Project 


The majority of OpenJDK code is released under the GNU General Public License Verslon 2 (GPLY2). 

Certain source based on existing open source projects will continue to be available under their currentlicenses Some binary components are covered under 
the Binary License for OpenJDK. Specific download pages and the source fle headers provide license Informaton assoclated with the avallable component 
Please note Some browsers may require you to rightclicyCTRL-clickto save these fes to your computer 


OpenJDK 
Summany of changes In JOK 7 bulld b147 


® Source 


openjdk-7-fcs-stc-b147-27_jun_2011.2ip. 83.18 MB (MDS Checksum) 
Repository 
http hg.openjdk java netidk74dk7 

War » 

People Partmers, and Jobs | OPenJDK modules project 

Java User Groups » Repositores 

RSS Feeds htpihg.openjdk java netjak7imodules 


2-1 下 载 打包 好 的 源码 


一 般 来 说 ， 大 概 一 个 月 左右 会 更 新 一 次 ， 虽 然 不 够 及 时 ， 但 的 确 方便 了 许多 。 笔 者 下 
载 的 是 openjdk-7-fcs-src-b147-27_jun_2011.zip 版 ，2011 年 6 月 27 日 发 布 的 ， 压 缩 包 大 小 
大 约 83.18MB。 


2.2.3 ”系统 需求 


在 Windows 平台 上 编译 JDK 之 前 ， 请 事先 认真 阅读 源码 中 的 README-builds.html 文 
档 ， 在 此 文档 中 盖 明 了 我 们 应 该 注意 的 细节 。 对 于 初学 者 来 说 ， 第 一 次 编译 需要 耗费 很 多 
时 间 是 很 正常 的 事情 。 

在 编译 时 ， 需 要 将 编译 涉及 的 所 有 文件 都 存放 在 NTFS 格式 的 文件 系统 中 ， 这 是 因为 
FAT32 格式 无 法 支持 大 小 写 敏感 的 文件 名 。 官 方 文档 明确 指出 了 编译 所 需 的 最 低 配 置 : 
512MB 的 内 存 和 600MB 的 磁盘 空间 。 其 实 600MB 的 磁盘 空间 仅仅 是 指 存放 OpenJDK 源 
码 和 相关 依赖 项 的 空间 ， 要 想 完成 编译 ， 仅 仅 600MB 的 空间 是 不 够 的 。 这 是 因为 在 编译 
过 程 中 所 需要 下 载 的 工具 、 依 赖 项 、 源 码 需要 超过 1GB 的 空间 。 

另外 还 建议 读者 ， 不 要 将 文件 (包括 源码 和 依赖 项 ) 放 在 包含 中 文 或 空格 的 目录 里 面 ， 
这 样 做 不 是 一 定 不 可 以 ， 只 是 这 样 会 为 后 续 建立 Cygwin 环境 带 来 很 多 额外 的 工作 ， 这 是 
由 于 Linux 和 Windows 的 磁盘 路 径 差别 所 导致 的 ， 我 们 也 没有 必要 自己 给 自己 找 麻 烦 。 


a 淮 


aa 和 拉 机 开 发 
优化 、 高 效 和 安全 的 最 优 方 


2.2.4 构建 编译 环境 


在 构建 编译 环境 步骤 中 ， 需 要 先 安装 Cygwin， 这 是 一 个 在 Windows 平台 下 模拟 Linux 
运行 环境 的 软件 ， 它 提供 了 一 系列 的 Linux 命令 支持 。 使 用 Cygwin 的 原因 是 ， 在 编译 过 
程 中 需要 使 用 GNU Make 执行 Makefile 文件 。 在 安装 Cygwin 时 不 能 直接 默认 安装 ， 因 为 
表 2-1 中 所 示 的 工具 都 不 会 进行 默认 安装 ， 但 又 是 编译 过 程 中 所 需要 的 ， 所 以 需要 在 图 2-2 


的 安装 界面 中 进行 手工 选择 。 
表 2-1 需要 手工 选择 安装 的 Cygwin 工具 
文件 名 分 类 包 描 述 
ar.exe Devel binutils | The GNU assembler, linker and binary utilities 
make.exe The GNU version of the "make' utility built for Cygwin 
m4.exe GNU implementation of the traditional Unix macro processor 
cpio.exe A program to manage archives of files 
gawk.exe Pattern-directed scanning and processing language 
file.exe Determines file type using ‘magic’ numbers 
Zip.exe Package and compress (archive) files 
Unzip.exe Extract compressed files in a ZIP archive 
free.exe System procps Display amount of free and used memory in the system 


Cygwin 安装 时 的 定制 包 选择 界面 如 图 2-2 所 示 。 
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图 2-2 Cygwin 的 安装 界面 


1. 下 载 、 安 装 Cygwin 


(1) 登录 Cygwin 的 官方 网 站 下 载 Cygwin 的 安装 程序 ， 其 官方 网 站 地 址 是 http://www. 
cygwin.com/。 
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或 者 直接 使 用 下 载 连接 来 下 载 安装 程序 ， 下 载 连 接 是 http://www.cygwin.com/setup.exe。 
(2) 下 载 完 成 后 ， 运 行 setup.exe 程序 ， 出 现 安装 画面 。 直 接 单 击 “ 下 一 步 ” 按 钮 ， 出 
现 安装 模式 对 话 框 ， 如 图 2-3 所 示 。 


etup 一 se ion Type 


Choose A Downioad Source 
hoose whether to nata or dowrioad from the riemet or netal from fies n E 


上 一 步 @)] 丰 一 步 如 > 职 滑 


2-3 ”安装 模式 对 话 框 


在 上 述 界 面 中 可 以 看 到 以 下 三 种 安装 模式 : 

口 ”Install from Internet: 这 种 模式 直接 从 Intemet 安装 ， 适 合 网 速 较 快 的 情况 ; 

口 “Download Without Installing: 这 种 模式 只 从 网 上 下 载 Cygwin 组 件 包 ， 但 不 安装 ; 

口 ”Install from Local Directory: 这 种 模式 与 第 二 种 模式 对 应 ， 当 你 的 Cygwin 组 件 包 

已 经 下 载 到 本 地 ， 则 可 以 使 用 此 模式 从 本 地 安装 Cygwin。 

从 上 述 三 种 模式 中 选择 适合 你 的 安装 模式 ， 这 里 我 们 选择 第 一 种 安装 模式 ， 直 接 从 网 
上 安装 ， 当 然 在 下 载 的 同时 ，Cygwin 组 件 也 保存 到 了 本 地 ， 以 便 以 后 能 够 再 次 安装 。 

(3) 选中 后 单 击 “ 下 一 步 ” 按 钮 ， 在 弹出 的 新 界面 中 选择 Cygwin 的 安装 目录 ， 以 及 一 
些 参数 的 设置 。 默 认 的 安装 位 置 是 “C:Cygwin\”， 你 也 可 以 选择 自己 的 安装 目录 ， 然 后 
单 击 “ 下 一 步 ” 按 钮 ， 如 图 2-4 所 示 。 

(4) 在 弹出 的 新 界面 中 选择 安装 过 程 中 从 网 上 下 载 的 Cygwin 组 件 包 的 保存 位 置 ， 如 
图 2-5 所 示 ， 然 后 单 击 “下 一 步 ”按钮 。 
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图 2-4 选择 安装 目录 图 2-5 从 网 上 下 载 的 Cygwin 组 件 包 的 保存 位 置 
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(5) 在 弹出 的 新 界面 中 选择 连接 方式 ， 然 后 单 击 “ 下 一 步 ” 按 钮 ， 如 图 2-6 所 示 。 

(6) 在 弹出 的 新 界面 中 选择 下 载 站 点 ， 为 了 获得 最 快 的 下 载 速度 ， 需 要 先 在 列表 中 寻 
找 Cygwin 中 国 镜像 的 地 址 http://www.cygwin.cn， 如 果 找 到 就 选中 这 个 地 址 ， 如 果 找 不 到 
这 个 地 址 ， 就 在 下 面 手动 输入 中 国 镜像 的 地 址 http://www.cygwin.cn/pub/， 然 后 再 单 击 Add 
按钮 ， 再 在 列表 中 选择 。 选 择 完成 后 ， 单 击 “ 下 一 步 ” 按 钮 ， 如 图 2-7 所 示 。 


yevin 二 Select Connection Type 一 一 一 一 -一 一 


LE Ee oer ensetotete E 
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I 
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[= 各 加] 攻 = 生 0 》 EF K 上-— 步 ®@) T= 步 WD > 取消 ] 
2-6 选择 连接 方式 2-7 选择 下 载 站 点 


(7) 在 弹出 的 新 界面 中 选择 需要 下 载 安装 的 组 件 包 ， 为 了 使 安装 的 Cygwin 能 够 编译 程 
序 ， 需 要 安装 gcc 编译 器 。 默 认 情况 下 ，gcc 并 不 会 被 安装 ， 我 们 需要 选中 它 来 安装 。 为 
了 安装 gcc， 要 打开 组 件 列表 中 的 Devel 分 支 ， 如 图 2-8 所 示 。 
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图 2-8 选择 需要 下 载 安装 的 组 件 包 
在 该 分 支 下 有 很 多 组 件 ， 我 们 必须 选择 下 面 的 选项 : 


口 binutils 

口 gcc 

口 gcc-mingw 

口 gdb 

单 击 组 件 前 面 的 循环 按钮 ， 会 出 现 组 件 的 版 本 日 期 ， 在 此 选择 最 新 的 版 本 安装 ， 图 2-9 一 
图 2-12 是 选中 的 四 类 组 件 的 截图 。 
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2-9 binutils 组 件 2-10 gcc 组件 
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图 2-11 gcc-mingw 组 件 图 2-12 gdb 组 件 
(8) 单 击 “ 下 一 步 ” 按 钮 进入 安装 过 程 ， 如 图 2-13 所 示 。 


安装 的 时 间 依 据 你 选择 的 组 件 以 及 网 络 情况 而 定 。 安 装 完成 后 ， 安 装 程序 会 提示 是 否 在 桌 
面 上 创建 Cygwin 图 标 等 ， 单 击 “ 完 成 ”按钮 退出 安装 程序 ， 如 图 2-14 所 示 。 
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图 2-13 安装 过 程 界面 图 2-14 安装 完成 界面 


(9) 安装 完成 后 ， 接 下 来 需要 配置 Cygwin 编译 器 。 首 先 启动 C-Free 进入 “构建 ” 菜 
单 ， 选 择 “ 构 建 选项 ”， 弹 出 “构建 选项 ”对 话 框 ， 如 图 2-15 所 示 。 

(10) 单 击 右 上 角 的 > 按钮 ， 在 出 现 的 菜单 中 选择 “新 建 配 置 ”命令 ， 出 现 “ 新 建构 建 
配置 ”对 话 框 ， 如 图 2-16 所 示 。 

在 “编译 器 类 型 ”下 拉 列 表 框 中 选择 CYGWIN， 在 “配置 名 称 ” 文 本 框 中 输入 名 称 ， 
这 里 输入 的 是 cygwin， 当 然 也 可 以 输入 你 自己 喜欢 的 名 称 。 

(11) 单 击 “ 确 定 ”按钮 后 弹出 “编译 器 位 置 ”对 话 框 ， 如 图 2-17 所 示 。 
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2-15 “构建 选项 ”对 话 框 


2-16 “新 建构 建 配置 ”对 话 框 
ET 加 


2-17 “编译 器 位 置 ”对 话 框 


因为 在 前 面 的 安装 步骤 中 ， 将 Cygwin 安装 到 了 “C:\Cygwin\” 目 录 下 ， 所 以 在 安装 位 
置 列表 中 会 看 到 C-Free 检测 到 了 这 个 目录 。 如 果 C-Free 检测 不 到 Cygwin 的 安装 目录 ， 则 
需要 手动 定位 安装 目录 。 

(12) 单 击 “ 确 定 ” 按 钮 后 ， 编 译 器 的 各 个 目录 就 自动 添加 到 了 这 个 构建 配置 中 。 如 
图 2-18 所 示 ， 分别 是 添加 完成 后 的 Include Files 目录 、Library Files 目录 以 及 Executable 
Files 目录 的 结果 截图 。 

如 果 发 现 C-Free 无 法 自动 检测 出 编译 器 的 位 置 ， 原 因 可 能 是 无 法 找到 安装 的 编译 器 目 
录 ， 此 时 需要 手动 添加 上 面 的 三 类 目录 。 完 成 后 单 击 “ 确 定 ” 按 钮 ， 这 样 就 完成 了 Cygwin 
编译 器 在 C-Free 中 的 配置 。 

通过 上 面 的 操作 ， 实 际 上 是 建立 了 一 个 名 为 “cygwin” 的 全 局 构建 配置 。 这 个 构建 配 
置 既 能 用 来 构建 单个 文件 ， 还 能 被 复制 为 工程 构建 配置 ， 用 来 构建 整个 工程 。 
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图 2-18 分别 添 加 目录 到 构建 选项 值 
(13) 完成 了 编译 器 在 C-Free 中 的 添加 工作 之 后 ， 就 可 以 在 C-Free 中 使 用 这 个 编译 器 
了 。 只 要 在 编译 时 选中 刚刚 添加 的 这 个 配置 ， 后 台 就 会 使 用 Cygwin 来 编译 ， 如 图 2-19 
所 示 。 
| 窗口 QD 帮助 0 


a 4- + 


Paesal 
寺中 这 1 配置 
| 
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图 2-20 显示 的 是 第 一 次 启动 Cygwin 时 的 情况 ， 创 建 主 目录 并 执行 shell 启动 文件 后 会 
有 提示 。 现 在 可 以 运行 UNIX 命令 了 。 
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图 2-20 ”启动 Cygwin 时 的 界面 


2. 安装 编译 器 

JDK 中 最 核心 的 代码 (Java 虚拟 机 及 JDK 中 Native 方法 的 实现 等 ) 是 使 用 C++ 语言 以 及 
少量 的 C 语言 编写 的 ， 在 其 官方 文档 中 声称 其 内 部 开发 环境 是 在 Microsoft Visual Studio 
C++ 2003(VS2003) 中 进行 编译 的 ， 同 时 也 在 Microsoft Visual Studio C++ 2010(VS2010) 中 测 
试 过 ， 所 以 最 好 只 选择 这 两 个 编译 器 之 一 进行 编译 。 如 果 选 择 VS2010， 那 么 在 编译 器 之 
中 已 经 包含 了 Windows SDK v7.0a， 否 则 可 能 还 要 自己 去 下 载 这 个 SDK， 并 且 更 新 
PlatformSDK 目录 。 笔 者 在 此 建议 读者 使 用 Visual Studio C++ 2010 或 Visual Studio C++ 
2010 Express 进行 编译 。 

需要 特别 注意 的 一 点 : Cygwin 和 VS2010 安装 之 后 都 会 在 操作 系统 的 PATH 环境 变量 
中 写 入 自己 的 bin 目录 路 径 ， 必 须 检 查 并 保证 VS2010 的 bin 目录 一 定 要 在 Cygwin 的 bin 
目录 之 前 ， 因 为 这 两 个 软件 的 bin 目录 之 中 各 自 都 有 个 连接 器 “link.exe”， 但 是 只 有 
VS2010 中 的 连接 器 可 以 完成 OpenJDK 的 编译 。 

下 载 并 安装 VS2010 的 基本 步骤 如 下 。 

(1) 将 安装 盘 放 入 光驱 ， 或 双击 存储 在 硬盘 内 的 安装 文件 autorun.exe， 弹 出 安装 界 
面 ， 如 图 2-21 所 示 。 

(2) 单 击 “ 安 装 Microsoft Visual Studio 2010” 链 接 ， 弹 出 组 件 加 载 对 话 框 ， 如 图 2-22 
所 示 。 

TT 于 加 


CQViualstudiczmo 


COVEasudic 


查看 上 运作 MU] 退出 6 = 
图 2-21 开始 安装 界面 图 2-22 组件 加 载 对 话 框 
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(3) 加 载 完毕 后 单 击 “ 下 一 步 ” 按 钮 后 弹出 安装 起 始 页 界面 ， 选 中 “我 已 阅读 并 接受 
许可 条 款 ”， 如 图 2-23 所 示 。 

(4) 单 击 “ 下 一 步 ”按钮 ， 弹 出 安装 选项 页 界面 ， 选 中 “完全 ”安装 和 安装 路 径 ， 如 
图 2-24 所 示 。 
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图 2-23 ”安装 起 始 页 界面 图 2-24 安装 选项 页 界面 


(5) 单 击 “安装 ” 按 钮 后 弹出 安装 页 界面 ， 开 始 进行 安装 ， 如 图 2-25 所 示 。 

(6) 安装 完毕 后 弹出 完成 页 界面 ，Visual Studio 2010 成 功 安装 完成 ， 如 图 2-26 所 示 。 
TEETER TET TE AIEEE -上 | -| 
DVREal studio m0 eu 让 OO Va studio oo tw a 


ET 人 


so 


sd 2 二 SN | LS sew | eral 
2-25 ”安装 页 界面 2-26 ”完成 页 界面 


Visual Studio 2010 容量 巨大 ， 有 数 G 之 巨 。 在 安装 过 程 中 一 定 要 有 耐心 ， 慢 慢 等 待 。 
如 果 以 前 在 机 器 上 安装 过 ， 建 议 用 钊 载 工具 将 原来 安装 的 资料 和 痕迹 完全 伸 载 后 再 安装 ， 
这 样 会 避免 很 多 不 必要 的 麻烦 。 在 图 2-25 所 示 的 安装 界面 中 ， 会 多 次 重新 启动 ， 此 时 不 要 
惊慌 ， 电 脑 重启 后 将 自动 进入 安装 界面 。 

另外 因为 需要 安装 很 多 组 件 ， 例 如 ， 数 据 库 和 IIS 等 组 件 ， 所 以 安装 过 程 中 总 会 出 现 
这 样 或 那样 的 问题 。 比 较 常见 的 问题 是 在 安装 Windows 组 件 时 ， 不 能 安装 IS 中 的 Front 
Page 服务 器 扩展 ， 已 经 插入 安装 光盘 了 ， 却 一 直 提 示 “ 将 XP profession service pack 2 CD 
插入 选 定 的 驱动 器 ”。 这 是 因为 Windows 的 系统 文件 保护 不 让 通过 ， 解 决 方法 是 关闭 文件 
保护 功能 ， 关 闭 方法 如 下 。 

(1) 运行 gpedit.msc 打开 组 策略 。 

(2) 依次 展开 至 计算 机 配置 一 管理 模板 一 系统 一 Windows 文件 保护 。 
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(3) 找到 “设置 文件 保护 ”， 双 击 并 修改 为 “已 禁用 ”， 然 后 重新 启动 系统 就 可 以 了 。 

上 面 的 方法 虽 可 行 ， 但 是 治标 不 治本 ， 还 有 种 方法 可 以 彻底 修复 Windows 文件 。 插 入 
系统 安装 光盘 ， 并 运行 sfe /scannow 命令 检测 并 修复 可 能 受 损坏 和 更 改 的 系统 文件 。 这 样 
就 不 会 再 出 现 此 问题 了 。 当 遇 到 上 述 问 题 时 ， 建 议 读者 先 试 试 第 一 个 方法 ， 再 试 试 第 二 个 
方法 。 

3. 下 载 一 个 已 经 编译 好 了 的 JDK 


因为 在 JDK 中 包含 的 各 个 部 分 ， 例 如 ，Hotspot、JDK API、JAXWS、JAXP， 这 些 部 
分 有 的 是 使 用 C++ 编 写 的 ， 而 更 多 的 代码 是 使 用 Java 语言 实现 的 ， 因 此 编译 这 些 Java 代 
码 需 要 用 到 一 个 可 用 的 JDK， 官 方 称 这 个 JDK 为 “Bootstrap JDK”。 而 编译 OpenJDK 7 的 
话 ，Bootstrap JDK 必须 使 用 JDK6 Update 14 或 之 后 的 版 本 ， 笔 者 选用 的 是 JDK7 Update 1。 

下 载 并 安装 JDK 的 基本 步骤 如 下 。 

(1) 在 Sun 官方 网 站 下 载 ， 网 址 为 http://developers.sun.com/downloads/， 如 图 2-27 所 示 。 
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2-27 Sun 官方 下 载 页 面 


(2) 在 图 2-27 中 可 以 看 到 有 很 多 版 本 ， 在 此 选择 当前 最 新 的 版 本 Java 7， 其 下 载 页 面 
如 图 2-28 所 示 。 

(3) 在 图 2-28 中 单 击 JDK 下 方 的 Download 按钮 ， 在 弹出 的 新 界面 中 选择 要 下 载 的 
JDK， 例 如 ， 笔 者 选择 的 是 Windows x86 版 本 ， 如 图 2-29 所 示 。 

(4) 下 载 完成 后 双击 下 载 的 “.exe” 文 件 开始 进行 安装 ， 将 弹出 安装 向 导 对 话 框 ， 单 击 
“下 一 步 ” 按 钮 ， 如 图 2-30 所 示 。 

(5) 弹出 安装 路 径 界面 ， 选 择 文件 的 安装 路 径 ， 如 图 2-31 所 示 。 

(6) 在 此 设置 的 安装 路 径 是 E:\jdk1.7.0_01\， 然 后 单 击 “ 下 一 步 ” 按 钮 开始 在 安装 路 径 
解压 缩 下 载 的 文件 ， 如 图 2-32 所 示 。 
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Java Platform, Standard Edition 


Java SETu1 JDK JRE 

This release includes many security fixes. Leam 
more » 

"What Java Dol Need?" You musthave a copy of «& JDK7 Docs JRE7 Docs 

the JRE (Java Runtime Environment) on your 。 Installation 。Installation 


System to run Java applications and applets. To 


I ion: Instructions 
develop Java applications and applets, you need oe. ia 
the JDK (Java Development Kit), which includes "ReadMe " ReadMe 
the JRE. 

"ReleaseNotes "ReleaseNotes 


* Oradle License * Oracle License 


* Java SE " Java SE 
Products Products 

* ThirdPary * ThirdPary 
Licenses Licenses 

"Certified System ”Certified System 
Configurations Configurations 


图 2-28 JDK 下载 页 面 


Oracle Binary Code License Agreement for Java SE to download this 


Accept License Agreement ‘ Decline License Agreement 


Product / File Description File se Download 

Linuxx86 77.27 MB § jdk-7u1-linuxi586.pm 

Linux x86 92.17 MB 世 jdk-7u1-linuxi586 tar gz 
Linuxx64 77.91 MB Sjdk-7u1-linwex54.rpm 
Linuxx64 90.57 MB jdk-7u1-linuxx54 tar gz 
Solaris x86 15478 MB 包 jdk-7u1-solaris-i586 tarZ 
Solaris x86 94.75 MB 世 jdk-7u1-solaris-i586 tar gz 
Solaris SPARC 157.81 MB 各 jdk-7u1-solaris-sparctarZ 
Solaris SPARC 99.48 MB 旬 jdk-7u1-solaris-sparctar gz 
Solaris SPARC 64-bit 16.27 MB 好 jdk-7Tu1-solaris-sparcvgtarZ 
Solaris SPARC 64-bit 12.37 MB 专 jdk-7u1-solaris-sparov9 targz 
Solaris x64 14.68 MB 各 jdk-7u1-solarisx64tarZ 
Solaris x64 9.38 MB 间 jdk-7u1-Solaris-x64 tar gz 
Windows x86 79.46 MB 好 jdk-Tu1-windows-i586 exe 
Windows x64 80.24 MB 至 jdk7Tulwindows-x64exe 


2-29 选择 Windows x86 版 本 
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欢迎 使 用 Java(TM) SE Development KGt 7 Update 1 安装 向 导 


JavaCTM) sE Development Gt 7Update 1 安装 程序 正在 准备 安装 向 导 ， 安 装 向 导 将 
引导 您 元 成 程序 安装 过 程 。 请 稍 候 。 


图 2-30 ”安装 向 导 对 话 框 


TN) SE Developeent_Iit 7 Update 1 BE 


2 Java” 


安装 到 ; 
C:\Program FlesUavalidk1.7.0.01\ 


< 上 一 步 @) | F—> 取消 


图 2-31 安装 路 径 界 面 图 2-32 解压 缩 下 载 的 文件 


(7) 完成 后 弹出 “目标 文件 夹 ”对 话 框 ， 选 择 要 安装 的 位 置 ， 如 图 2-33 所 示 。 
(8) 单 击 “ 下 一 步 ”按钮 后 开始 正式 安装 ， 如 图 2-34 所 示 。 


S| 
a [ER | 
3 Billion Devices Run Java 
职 消 下 一 步 0 > 
图 2-33 “目标 文件 夹 ”对 话 框 图 2-34 ”继续 安装 
(9) 安装 完成 后 弹出 “完成 ”对 话 框 ， 单 击 “ 完 成 ”按钮 完成 整个 安装 过 程 ， 如 图 2-35 
所 示 。 


Java(TM) SE Development Kit 7 Update 1 已 成 功 安装 


产品 注册 是 免费 的 ， 修 兰 获 得 加 下 增 信服 务 : 

= 苞 得 新 版 本 、 修 补 程序 和 更 新 的 通知 服务 

“ 获 旬 有 关 Orade 开发 者 产品 、 服 务 和 培训 的 忧 囊 
“获得 对 早期 版 本 和 文档 的 访问 权限 


当 黎 单 击 -完成 -后 柠 收 集 产品 与 系 撤 信 息 ， 同 时 星 示 2DK 产品 注册 表单 。 如 果 您 
不 注册 , 则 不 保存 以 上 信息 。 


有 关注 册 所 收集 的 数据 以 及 这 些 数 据 的 管理 和 使 用 方式 的 更 多 信息 ， 请 参见 产品 
注册 信息 页面。 


产品 注册 信息 所 
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安装 完成 后 可 以 检测 是 否 安装 成 功 ， 检 测 方法 是 依次 单 击 “开始 ”一 “运行 ”命令 ， 
在 “运行 ”对 话 框 中 输入 “cmd” 并 按 Enter 键 ， 在 打开 的 cmd 窗口 中 输入 “java 一 
version”， 如 果 显 示 如 图 2-36 所 示 的 提示 信息 ， 则 说 明 安装 成 功 。 


FC: WINDOYS\systen32\em' 


2-36 ”cmd 窗口 
4. 安装 Apache Ant 


Apache Ant 是 一 个 款 将 软件 编译 、 测 试 、 部 署 等 步骤 联系 在 一 起 加 以 自动 化 的 一 个 工 
具 ， 大 多 用 于 Java 环境 中 的 软件 开发 。 由 Apache 软件 基金 会 所 提供 。 

Apache Ant 的 用 户 群 大 多 数 的 Java 设计 都 被 用 于 管理 大 量 信息 流 ， 例 如 ， 纽 约 州 就 使 
用 Apache Ant 去 管理 美国 最 大 的 青年 计划 ， 每 天 可 以 实时 更 新 超过 25 万 学 生 的 记录 。 

JDK 中 Java 代码 部 分 都 是 使 用 ANT 脚本 进行 编译 的 ， 在 编译 时 要 求 ANT 的 版 本 在 
1.6.5 以 上 。 下 载 并 安装 Apache Ant 的 基本 步骤 如 下 所 示 。 

(1) 登录 Apache Ant 等 官方 地 址 http://ant.apache.org/bindownload.cgi 进行 下 载 。 

(2) 将 下 载 到 的 文件 解压 到 你 想 放 置 的 盘 符 ， 例 如 D:\Program Files\ant\apache-ant- 
1.8.1。 

(3) 将 FB 安装 路 径 下 的 flexTasksjar 复制 到 ANT 根 路 径 下 的 lib 中 。 文 件 
flexTasksjar 在 FB 中 的 路 径 是 C:\Program Files\Adobe\Adobe Flash Builder 4.0.0\ant\lib。 
ANT 下 的 lib 路 径 是 D:\Program Files\ant\apache-ant-1.8.1\ib。 

(4) 配置 环境 变量 。 

变量 : ANT_HOME。 

值 : 是 刚 解压 到 的 路 径 ， 即 D:\Program Files\ant\apache-ant-1.8.1。 

设置 Path: "%ANT_HOME?%bin。 

到 此 为 止 ， ANT 就 安装 完成 了 ， 运 行 cmd， 输 入 ANT， 如 果 没 有 指定 build.xml 则 会 
输出 : 


Buildfile: build.xml does not exist! 
Build failed 


例如 : 


C:\Documents and Settings\Administrator>ant 
Buildfile: build.xml does not exist! 
Build failed 


2.2.5 准备 依赖 项 
在 具体 编译 之 前 ， 还 需要 准备 下 面 的 依赖 项 。 
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1. 安装 JDK Plug 


OpenJDK 中 的 源码 并 没有 100% 开 源 ， 还 有 少量 部 分 的 无 法 开源 的 产权 代码 。 虽 然 
OpenJDK 承诺 日 后 将 逐步 开源 这 部 分 产权 代码 ， 但 现在 编译 JDK 还 需要 这 部 分 闭 源 包 ， 
官方 称 之 为 “JDK Plug”， 它 们 从 前 面 的 Source Releases 页 面 就 可 以 下 载 到 。 在 2011 以 
前 的 版 本 中 ， 还 需要 使 用 JDK plug， 在 之 后 的 版 本 中 就 不 需要 JDK plug 了。 

在 Windows 平台 的 JDK Plug 是 以 Jar 包 的 形式 提供 的 ， 通 过 如 下 命令 可 以 将 其 安装 : 

java -jar jdk-7-ea-plug-bl21-windows-i586-09 dec 2010.jar 

运行 后 将 会 显示 如 图 2-37 所 示 的 协议 ， 单 击 ACCEPT 按钮 接受 协议 ， 然 后 把 Plug 安 
装 到 指定 目录 。 安 装 完毕 后 建立 一 个 名 为 ALT_BINARY _PLUGS PATH 的 环境 变量 ， 变 
量 值 为 此 JDK Plug 的 安装 路 径 ， 后 面 编译 程序 时 需要 用 到 它 。 


Binary ucenseforopenJDK 


[Sun Microsystems,. Inc. Binary Code License Agreement 
[SUN MICROSYSTEMS. INC. (SUN") IS WILLING TO LICENSE THE SOFTWARE TO YOU 

NLY UPON THE CONDITION THAT YOU ACCEPT ALL OF THE TERMS CONTAINED IN THIS 
[BINARY CODE LICENSE AGREEMENT CAGREEMENT). PLEASE READ THE AGREEMENT 

AREFULLY. BY DOWNLOADING OR INSTALLING THIS SOFTWARE, YOU ACCEPTTHE 
FuuL 

ERMS OF THIS AGREEMENT 


| _AccEPT DECLINE 


2-37 ”协议 界面 
2. 引用 JDK 的 运行 时 包 


除了 要 用 到 JDK Plug 外 ， 编 译 时 还 需要 引用 JDK 的 运行 时 包 ， 用 Java 语言 编写 的 部 
分 需要 用 到 这 个 包 。 如 果 仅仅 是 想 编译 一 个 HotSpot 虚拟 机 ， 则 可 以 不 用 这 个 包 。 官 方 文 
档 把 这 部 分 称 之 为 “Optional Import JDK”， 可 以 直接 使 用 前 面 Bootstrap JDK 的 运行 时 
包 ， 我 们 需要 建立 一 个 名 为 ALT_JDK_IMPORT _PATH 的 环境 变量 ， 并 且 这 个 变量 指向 
JDK 的 安装 目录 。 


3. 安装 FreeType 库 


FreeType 库 是 一 个 完全 免费 (开源 ) 的 、 高 质量 的 且 可 移植 的 字体 引擎 ， 它 提供 统一 的 
接口 来 访问 多 种 字体 格式 文件 ， 包 括 TrueType、OpenType、Typel、CID、CFF、Windows 
FON/FNT、X11 PCF 等 。FreeType 支持 单 色 位 图 、 反 走样 位 图 的 渲染 ， 是 一 个 高 度 模 块 化 
的 程序 库 ， 虽 然 它 使 用 ANSI C 开发 ， 但 是 采用 面向 对 象 的 思想 ， 所 以 FreeType 用 户 可 以 
灵活 地 对 它 进行 裁剪。 

为 了 编译 JDK， 我 们 需要 安装 一 个 2.3 以 上 版 本 的 FreeType，JDK 的 Swing 部 分 和 
JConsole 这 类 工具 要 使 用 到 它 。 安 装 好 后 建立 两 个 环境 变量 ALT_ FREETYPE LIB PATH 
和 ALT FREETYPE HEADERS PATH， 分 别 指向 FreeType 安装 目录 下 的 bin 目录 和 
include 目录 ， 另 外 ， 还 需要 把 FreeType 的 bin 目录 加 入 到 PATH 环境 变量 中 。 


人 
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4. 安装 Microsoft DirectX 9.0 SDK 


微软 的 DirectX 包括 加 速 视频 卡 和 声卡 驱动 程序 ， 能 够 为 不 同类 型 的 多 媒体 提供 更 好 
的 播放 效果 ， 例如， 全 色 图 形 、 图 像 、 三 维 动画 、 音 乐 ， 以 及 剧场 声音 。DirectX 使 用 这 
些 高 级 功能 而 不 要 求 识别 计算 机 中 的 硬件 组 件 ， 并 确保 大 多 数 软件 可 以 在 大 部 分 硬件 系统 
上 运行 。DirectX 由 应 用 程序 编程 接口 (APD 组 成 ， 又 分 成 DirectX 基础 层 和 DirectX 媒体 
层 两 类 。 这 些 API 可 以 让 程序 直接 访问 计算 机 的 许多 硬件 设备 。 

读者 可 以 登录 微软 的 官方 网 站 下 载 Microsoft DirectX 9.0 SDK， 它 是 完全 免费 的 。 安 装 
后 建立 环境 变量 ALT_DXSDK PATH 指向 DirectX 9.0 SDK 的 安装 目录 。 


5. 使 用 MSVCR100.DLL 动态 链接 库 


在 编译 时 需要 一 个 名 为 “MSVCR100.DLL” 的 动态 链接 库 ， 如 果 已 经 安装 了 Visual 
Studio 2010， 那 么 在 本 机 就 能 找到 这 个 文件 。 找 到 后 新 建 环 境 变量 ALT_MSVCRNN_ 
DLL PATH 指向 这 个 文件 所 在 的 目录 。 如 果 读 者 选择 的 是 VS2003， 则 此 文件 名 为 
MSVCR73.DLL， 可 以 从 网 络 资源 中 获取 。 


2.2.6 ”开始 编译 


经 过 本 章 前 面 步骤 的 准备 之 后 ， 接 下 来 就 可 以 进行 具体 的 编译 工作 了 。 具 体 的 编译 步 
又 如 下 。 

(1) 执行 VS2010 中 的 VCVARS32.BAT， 这 个 批 处 理 文件 的 目的 主要 是 设置 
INCLUDE、LIB 和 PATH 这 几 个 环境 变量 ， 如 果 和 笔者 一 样 只 是 下 载 了 编译 器 的 话 则 需要 
手工 设置 它们 ， 各 个 环境 变量 的 设置 值 可 以 参考 下 面 步骤 (3) 后 面 的 代码 内 容 。 批 处 理 运行 
完 之 后 建立 ALT_ COMPILER PATH 环境 变量 让 Makefile 知道 在 哪里 可 以 找到 编译 器 。 

(2) 分 别 建立 名 为 ALT BOOTDIR 和 ALT JDK IMPORT PATH 的 两 个 环境 变量 ， 它 
们 指向 前 面 提 到 的 JDK 7 的 安装 目录 。 

(3) 建立 ANT_HOME 指向 Apache ANT 的 安装 目录 。 整 个 过 程 需要 建立 很 多 环境 变 
各 个 变量 的 具体 说 明 如 下 所 示 。 

SET ALT BOOTDIR=D:/ DevSpace/JDK 1.7.0 1 

SET ALT BINARY PLUGS PATH=D:/jdkBuild/jdk7plug/openjdk-binary-plugs 

SET ALT JDK IMPORT PATH=D:/ DevSpace/JDK 1.7.0 01 

SET ANT HOME=D:/jdkBuild/apache-ant-1.8.1 

SET ALT MSVCRNN DLL PATH=D: /jdkBuild/msvcr100 

SET ALT DXSDK PATH=D:/jdkBuild/msdxsdk 

SET ALT COMPILER PATH=D:/jdkBuild/vcpp2010.x86/bin 


SET ALT FREETYPE HEADERS PATH=D:/jdkBuild/freetype-2.3.5-1-bin/include 
SET ALT FREETYPE LIB PATH=D:/jdkBuild/freetype-2.3.5-1-bin/bin 


量 


SET INCLUDE=D:/jdkBuild/vcpp2010.x86/include;D:/jdkBuild/vcpp2010.x86/ 
sdk/Include; $INCLUDES 

SET LIB=D:/jdkBuild/vcpp2010.x86/1ib;D:/jdkBuild/vcpp2010.x86/sdk/Lib; $LIBS 
SET LIBPATH=D:/jdkBuild/vcpp2010.x86/1ib;$LIBS 

SET PATH=D:/jdkBuild/vcpp2010.x86/bin;D:/jdkBuild/vcpp2010.x86/d11/ 
X86;D:/Software/OpenSource/Cygwin/bin;®%ALT FREETYPE LIB PATHS;%SPATHS 


PT OO OE p> 
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上 述 各 个 软件 都 是 前 面 下 载 的 ， 具 体 版 本 号 是 笔者 写 稿 时 的 版 本 ， 读 者 可 以 根据 实际 
情况 蔡 换 为 自己 软件 的 版 本 号 。 

(4) 取消 环境 变量 JAVA_HOME。 

(5) 接 下 来 正式 开始 进行 编译 工作 。 进 入 控制 台 (Cmd.exe) 后 运行 刚才 准备 好 的 设置 环 
境 变 量 的 批 处 理 文件 ， 然 后 输入 “bash” 进 入 Boume Again Shell 环境 。 输 入 “make sanity” 
来 检查 我 们 前 面 所 做 的 设置 是 否 全 部 正确 。 如 果 JDK 的 安装 源码 中 存在 “jdk_generic_ 
profile.sh”Shell 脚本 ， 则 需要 先 执 行 它 。 如 果 一 切 顺利 则 会 出 现 类 似 下 面 的 输出 。 


D:\jdkBuild\openjdk7>bash 
bash-3.2$ make sanity 
Cygwin warning: 
MS-DOS style path detected: C:/Windows/system32/wscript .exe 
Preferred POSIX equivalent is: /cygdrive/c/Windows/system32/wscript.exe 
Cygwin environment variable option "nodosfilewarning" turns off this 
warning. 
Consult the user's guide for more details about POSIX paths: 
http://Cygwin.com/Cygwin-ug-net/using.html#using-pathnames 
(cd ./jdk/make && \ 


OpenJDK-specific settings: 
FREETYPE HEADERS PATH = D:/jdkBuild/freetype-2.3.5-1-bin/include 
ALT FREETYPE HEADERS PATH = D:/jdkBuild/freetype-2.3.5-1-bin/include 
FREETYPE LIB PATH = D:/jdkBuild/freetype-2.3.5-1-bin/bin 
ALT FREETYPE LIB PATH = D:/jdkBuild/freetype-2.3.5-1-bin/bin 


OPENJDK Import Binary Plug Settings: 
IMPORT BINARY PLUGS = true 
BINARY PLUGS JARFILE = D:/jdkBuild/jdk7plug/openjdk-binary- 
plugs/jre/lib/rt-closed.jar 
ALT BINARY PLUGS JARFILE = 
BINARY PLUGS PATH = D:/jdkBuild/jdk7plug/openjdk-binary-plugs 
ALT BINARY PLUGS PATH = D:/jdkBuild/jdk7plug/openjdk-binary-plugs 
BUILD BINARY PLUGS PATH = 
J:/re/jdk/1.7.0/promoted/latest/openjdk/binaryplugs 
ALT BUILD BINARY PLUGS PATH = 
PLUG LIBRARY NAMES = 


Previous JDK Settings: 
PREVIOUS RELEASE PATH = USING-PREVIOUS RELEASE IMAGE 
ALT PREVIOUS RELEASE PATH = 
PREVIOUS JDK VERSION = 1.6.0 
ALT PREVIOUS JDK VERSION = 
PREVIOUS JDK FILE = 
ALT PREVIOUS JDK FILE = 
PREVIOUS JRE FILE = 
ALT PREVIOUS JRE FILE = 
PREVIOUS RELEASE IMAGE = D:/ DevSpace/JDK 1.7.0 1 
ALT PREVIOUS RELEASE IMAGE = 
Sanity check passed. 


Makefile 的 Sanity 检查 过 程 会 输出 编译 所 需 的 所 有 环境 变量 ， 如 果 输 出 “Sanity check 
passed.”， 则 说 明 检 查 过 程 通过 了 。 此 时 就 可 以 输入 “make” 执 行 整个 Makefile， 如 果 失 
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败 则 需要 根据 系统 输出 的 失败 原因 ， 回 头 再 检查 一 下 对 应 的 设置 。 并 且 最 好 在 下 一 次 编译 
之 前 先 执 行 “make clean” 来 清理 掉 上 次 编译 遗留 的 文件 。 

(6) 编译 成 功 之 后 ， 打 开 OpenJDK 源码 下 的 build 目录 ， 会 发 现 新 增 了 一 个 编译 好 的 
JDK 文件 。 双 击 打 开 此 文件 ， 然 后 执行 “java -version”， 可 以 看 到 以 自己 机 器 命名 的 
JDK。 

注意 : 为 了 提高 编译 的 成 功率 ， 建 议 大 家 尽量 在 英文 版 本 的 操作 系统 上 进行 编译 工 
作 。 如 果 不 能 在 英文 的 系统 上 编译 ， 可 以 尝试 把 系统 的 文字 格式 调整 为 “英语 (美国 )”， 
在 “控制 面板 ”一 “区 域 和 语言 选项 ”的 第 一 个 选项 卡 中 进行 设置 即 可 。 


2.3 在 Linux 平 台 编译 JDK 


本 章 前 面 已 经 详细 讲解 了 在 Windows 平台 编译 JDK 的 步骤 。 本 节 将 详细 讲解 基于 
XUbuntu 10.10 平台 ， 以 JRL 源码 构建 JDK 6 update 23 的 基本 步骤 。 
(1) 首先 获取 JDK 的 最 新 源码 ， 本 节 使 用 的 是 以 下 两 个 文件 包 。 
口 “ jdk-6u23-fcs-bin-b05-jrl-12_ nov_2010.jar 
口 “jdk-6u23-fcs-src-b05-jrl-12_ nov_2010.jar 
(2) 依次 安装 如 下 软件 包 。 
build-essential 
gawk 
m4 
openjdk-6-jdk 
libasound2-dev 
libcups2-dev 
libxrender-dev 
xXorg-dev 
xutils-dev 
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吕 xllproto-print-dev 
下 面 是 对 应 的 安装 命令 : 


$ sudo apt-get install build-essential gawk m4 openjdk-6-jdk libasound2- 
dev libcups2-dev libxrender-dev xorg-dev xutils-dev xllproto-print-dev 


上 述 命令 的 具体 说 明 如 下 : 

口 “build-essential、gawk、m4、binutils: 是 Linux 上 的 一 些 基本 工具 ，build 许多 东 
西 都 需要 它们 。build-essential 主要 用 来 装 gt+(GNU C++ 编译 器 ) 及 C++ 标 准 库 ; 
gawk 是 GNU 版 awk， 用 来 做 文本 操作 ; m4 是 一 种 模板 语言 ，AWT 的 
DebugHelper 依赖 它 来 生成 部 分 源码 ;binutils 主要 是 链接 器 、 汇 编 器 、 反 汇编 器 
之 类 的 。 

口 、”openjdk-6-jdk: 要 想 build JDK， 需 要 先 安 装 一 个 启动 用 的 JDK(Bootstrap JDK)。 
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apt-get 默认 将 它 安 装 在 msrlib/jvnyjava-6-openjdk 目录 中 。build 的 时 候 要 把 
ALT _ BOOTDIR 设置 到 它 的 安装 目录 上 。 这 里 装 Sun JDK 来 做 Bootstrap JDK 
也 行 。 

口 libasound2-dev: 是 Advanced Linux Sound Architecture (ALSA) 相 关 的 依赖 。 

libcups2-dev: 是 Common UNIX Printing System (CUPS) 相 关 的 依赖 。 

口 jlibxrender-dev、xorg-dev、xutils-dev、x1l1lproto-print-dev: 都 是 相关 的 依赖 ， 主 要 
功能 是 编译 出 AWT 的 部 分 。 在 安装 完 这 部 分 后 ， 还 需要 专门 设置 一 个 符号 链 
接 ， 把 “/usr/lib” 映 射 为 “/usr/X11R6” 的 别名 ,这样 编 译 过 程 才 能 正确 找到 
X11 的 头 文件 : 
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$ sudo mkdir /usr/X11R6 
$ cd /usr/X11R6/ 
$ sudo ln -s -T /usr/lib lib 


注意 : 如 果 编 译 过 程 中 有 意外 错误 发 生 ， 则 需要 安装 binutils， 下 面 是 对 应 的 命令 : 


$ sudo apt-get install binutils 


(3) 将 如 下 源码 文件 解压 到 同一 目录 下 ， 确 保 该 目录 有 读 写 权限 ， 并 确认 该 目录 有 4G 
以 上 的 剩余 空间 可 用 。 

口 jdk-6u23-fes-src-b05-jrl-12 nov_2010.jar 

口 “jdk-6u23-fcs-bin-b05-jrl-12_ nov_2010.jar 

例如 ， 笔 者 将 源码 包 是 解压 到 了 /media/JDK6_build_area/jdk6u23 目录 中 。 

(4) 解 决 缺 少 符号 问题 ， 在 解压 出 来 的 源码 目录 中 的 文件 j2se/src/solaris/native/ 
sun/awt/awt_ GraphicsEnv.c 中 找到 如 下 代码 : 


if (xerr->minor code == X ShmAttach) { 
将 XShmAttach 改 为 1， 即 修改 后 变 为 : 
if (xerr->minor code == 1) { 


(5) 开始 设置 环境 变量 ， 在 此 编译 过 程 中 只 需要 设置 一 个 环境 变量 。 

$ export LANG=C 

如 果 环境 中 已 经 设置 了 JAVA_HOME， 则 需要 用 如 下 命令 删除 此 环境 变量 ， 否 则 在 编 
译 过 程 中 会 有 异常 发 生 。 

$ unset JAVA HOME 

(6) 开始 检查 编译 环境 的 正确 性 。 使 用 make dev-sanity 命令 即 进入 到 解压 后 源码 包 的 
contro/make 目录 中 ， 在 该 命令 后 面 需要 带 上 一 些 环境 参数 ， 完 整 命令 如 下 : 


$ make dev-sanity BUILD DEPLOY=false SKIP COMPARE IMAGES=true 

ALT BOOTDIR=/usr/1lib/jvm/java-6-openjdk ALT DEVTOOLS PATH=/usr/bin 
HOTSPOT BUILD JOBS=2 

下 面 是 对 上 述 命令 中 主要 参数 的 说 明 : 

口 dev( 或 者 DEV_ONLY): 设置 为 true 可 以 让 另外 三 个 变量 SKIP COMPARE_ 
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IMAGES、BUILD _INSTALL 和 NO_DOCS 也 变 为 true。 

口 BUILD DEPLOY: 设置 为 false 可 以 避 开 javaws 和 浏览 器 Java 插件 之 类 的 部 分 
的 编译 。 

口 BUILD _ INSTALL: 设置 为 false 就 不 会 编译 出 安装 包 。 因 为 安装 包 里 有 些 奇 怪 的 
依赖 ， 但 即便 不 编译 出 它 也 已 经 能 得 到 完整 的 JDK 映像 ， 所 以 建议 别 编译 它 。 

口 SKIP COMPARE IMAGES: 能 够 比较 本 次 编译 出 来 的 映像 与 先前 版 本 的 差异 。 
这 个 对 我 们 来 说 没有 意义 ， 建 议 直 接 设置 为 false， 否 则 sanity 检查 会 报 缺 少 先 前 
版 本 JDK 的 映像 。 如 果 有 设置 dev 或 者 DEV_ONLY=true 的 话 ， 可 以 不 显 式 
设置 。 

口 ALT BOOTDIR: 表示 Bootstrap JDK 的 安装 路 径 ， 必 须 设 置 。 

ALT DEVTOOLS PATH: 表示 zip 和 unzip 工具 所 在 的 路 径 ， 必 须 设置 。 

口 HOTSPOT BUILD JOBS: 主要 用 于 设置 编译 HotSpot 的 过 程 的 并 发 程度 ， 基 本 
上 设 到 跟 CPU 的 核 数 一 样 多 ， 也 可 以 不 设置 。 

口 ALT JDK IMPORT PATH: 不 用 设置 此 变量 。 因 为 要 编译 的 JDK 足够 完整 ， 缺 
少 的 部 分 我 们 都 不 需要 。 

下 面 是 检查 过 程 的 完整 输出 日 志 : 

$ make dev-sanity BUILD DEPLOY=false SKIP COMPARE IMAGES=true 

ALT BOOTDIR=/usr/l1ib/jvm/java-6-openjdk ALT DEVTOOLS PATH=/usr/bin 

HOTSPOT BUILD JOBS=2 

cd ../../control/make 

make sanity DEV ONLY=true 

make [1] : Entering directory 

`“/media/JDK6 build area/jdk6u23/control/make' 


make[2] : Entering directory ‘/media/JDK6 build area/jdk6u23/j2se/make' 
make [2] : Leaving directory ‘/media/JDK6 build area/jdk6u23/]jJ2se/make' 


Cc 


Build Machine Information: 
build machine = 


Build Directory Structure: 
CWD = /media/JDK6 build area/jdk6u23/control/make 
TOPDIR = ../.. 


CONTROL TOPDIR control 


HOTSPOT TOPDIR = ../../hotspot 

J2SE TOPDIR = ../../j2se 

MOTIF TOPDIR = ../../motif 
Build Directives: 

BUILD HOTSPOT = true 

BUILD MOTIF = true 

BUILD J2SE = true 


BUILD DEPLOY = false 
BUILD INSTALL = false 
(在 此 省 略 部 分 日 志 ) 
WARNING: Your are not building DEPLOY workspace from 
the control build. This will result in a development-only 
build of the J2SE workspace, lacking the plugin and javaws 


四 << a 
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binaries. 


WARNING: Your are not building INSTALL workspace from 
the control build. This will result in a development-only 
build of the J2SE workspace, lacking the installation bundles 


WARNING: Your build environment has the variable DEV ONLY 
defined. This will result in a development-only 
build of the J2SE workspace, lacking the documentation 
build and installation bundles - 


WARNING: The official linux builds use OS version 2.4.9-e.3. 
You appear to be using OS version 2.6.35-24-generic. 


WARNING: The build is being done on Linux Unknown linux. 
The official linux builds use Linux Advanced Server, 
specifically Linux Advanced Server release 2.1AS. 
The version found was '2.6.35-24-generic'. 


WARNING: The directory HOTSPOT DOCS IMPORT PATH=/NO DOCS DIR 
does not exist, check your value of ALT HOTSPOT DOCS IMPORT PATH. 


WARNING: The linux compiler must be version 3.2 
Specifically the GCC compiler. 
You appear to be using compiler version: 4.4 
The compiler was obtained from the following location: 
/usr/bin/ 
Please change your compiler. 


WARNING: Importing CUPS from a system location 


Sanity check passed. 
make[1]: Leaving directory ‘/media/JDK6 build area/jdk6u23/control/make' 


(7) 在 设置 好 环境 之 后 ， 接 下 来 正式 开始 编译 。 在 解压 出 来 的 源码 包 的 control/make 目 


录 中 连续 执行 两 次 下 述 命令 即 可 。 


$ make dev BUILD DEPLOY=false SKIP COMPARE IMAGES=true 
ALT BOOTDIR=/usr/l1ib/jvm/java-6-openjdk ALT DEVTOOLS PATH=/usr/bin 
HOTSPOT BUILD JOBS=2 


其 中 后 一 次 运行 时 间 会 比较 长 ， 大 家 需要 耐心 等 待 。 之 所 以 执行 两 次 的 原因 是 源码 


包 中 所 包含 的 Motif 不 能 一 次 顺利 编译 成 功 。 当 第 一 次 执行 上 述 命令 后 会 看 到 如 下 类 似 
错误 : 


gcc: /media/JDK6 build area/jdk6u23/control/build/linux-i586/motif— 
i586/1ib/libxm.a: No such file or directory 

make[4]: *** [/media/JDK6 build area/jdk6u23/control/build/linux— 
i586/1ib/i386/motif21/libmawt.so] Error 1 

make[4]: Leaving directory 

“/media/JDK6 build area/jdk6u23/j2se/make/sun/motif21" 

make[3]: **#* [all] Error 1 

make[3]: Leaving directory 
‘/media/JDK6 build area/jdk6u23/j2se/make/sun' 
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make[l2]: *** [alll Error 1 

make[2]: Leaving directory ‘/media/JDK6 build area/jdk6u23/j2se/make' 
make[1]: *** [j2se-build] Error 2 

make[1]: Leaving directory ‘/media/JDK6 build area/jdk6u23/control/make" 
make: *** [dev-build] Error 2 


只 要 第 二 次 编译 就 可 以 解决 上 述 错误 ，build 成 功 后 可 以 看 到 如 下 类 似 信息 : 


generic debug build build finished: 11-01-16 03:11 

make[2]: Leaving directory ‘/media/JDK6 build area/jdk6u23/control/make' 
Control workspace build finished: 11-01-16 03:11 

make[1]: Leaving directory ‘/media/JDK6 build area/jdk6u23/control/make' 


通过 如 下 命令 ， 可 以 进入 build 出 来 的 JDK 映像 的 bin 目录 中 。 


rednaxelafx@vbox:/media/JDK6 build area/jdk6u23/control/make$ cd ../buil 
d/linux-i586/j2sdk-image/bin/ 

rednaxelafx@vbox:/media/JDK6 build area/jdk6u23/control/build/linux-— 
i586/j2sdk-image/bin$ ./java -version 

java version "1.6.0-internal" 

Java(TM) SE Runtime Environment (build 1.6.0-internal-— 

rednaxelafx 16 jan 2011 02 10-b00) 

Java HotSpot (TM) Server WM (build 19.0-b09, mixed mode) 
rednaxelafx@vbox:/media/JDK6 build area/jdk6u23/control/build/linux-— 
i586/j2sdk-image/bin$ cd ../../j2sdk-debug-image/fastdebug/bin/ 
rednaxelafx@vbox:/media/JDK6 build area/jdk6u23/control/build/linux-— 
i586/j2sdk-debug-image/fastdebug/bin$ ./java -version 
java version "1.6.0-internal-fastdebug" 

Java (TM) SE Runtime Environment (build 1.6.0-internal-fastdebug- 
rednaxelafx 16 jan 2011 02 38-b00) 
Java HotSpot (TM) Server WM (build 19.0-b09-fastdebug, mixed mode) 


这 样 整 个 编译 过 程 就 结束 了 ， 编 译 出 来 的 JDK 里 的 Jconsole 可 以 正常 运行 了 ， 如 图 2-38 
所 示 。 


oy Thraads | Classes VM Summary | MBeans 
VM Summary 
2 


day Jant 


Total complle lime: 13 


Live threads 32 current classes loaded: 3,258 

Peak: 区 ‘Total classes loaded: 3.250 

Daemon threads: 3 Total classes unloaded: 9 
‘Total threads started: <0 


Current beap slze。 19,6%0 kby'os (Committed memory 25,59 kiytes 
Maximum heap size: = Pending finalization: olecs 
Garbage collecto! Teta) ame spent = 0.056 seconds 
Garbage oollecto! te spen ~ 0.190 Ecoads 


Operating System Lincx2 ne Total physical memory: 2.05, 
Architecture: Des Free physical memory 


图 2-38 运行 自己 编译 的 JDK 


”安全 性 的 考虑 


除了 平台 无 关 性 以 外 ，Java 还 必须 解决 的 另 一 个 技术 难题 就 是 安全 。 因 为 
网 络 中 运行 的 多 台 计 算 机 共享 数据 和 分 布 式 处 理 ， 所 以 它 提供 了 一 条 侵入 计算 
机 系统 的 潜在 途径 ， 使 得 其 他 人 有 机 会 窃取 、 改 变 或 破坏 信息 ， 盗 取 计 算 资 源 
等 。 因 此 ， 将 计算 机 联 入 网 络 引 发 了 很 多 安全 问题 。 为 了 解决 由 网 络 引 起 的 安 
全 问题 ，Java 体系 结构 采用 了 一 个 扩展 的 内 置 安全 模型 ， 这 个 模型 随 着 Java 
平台 的 主要 版 本 不 断 发 展 。 


he 


3.1 为 什么 需要 安全 性 


Java 的 安全 模型 是 其 多 个 重要 结构 特点 之 一 ， 它 能 够 使 Java 技术 适应 于 网 络 环境 的 特 
殊 性 需求 。 因 为 很 多 网 络 应 用 是 面向 全 体 网 民 的 ， 并 且 不 分 贵贱 ， 所 以 这 时 候 安全 性 就 变 
得 非常 重要 。 如 果 在 一 个 环境 中 ， 软 件 可 以 通过 网 络 下 载 并 在 本 地 运行 ， 这 时 就 需要 更 加 
注意 安全 问题 ， 例 如 Java Applet 和 JINI 服务 对 象 就 是 这 样 的 例子 。 因 为 当 用 户 在 浏览 器 
中 打开 网 页 时 ， 会 自动 下 载 applet 的 class 文件 ， 用 户 很 有 可 能 会 遇 到 来 自 不 可 靠 来 源 的 
applet。 同 样 的 道理 ， 当 一 个 JINI 服务 对 象 用 JINI 查找 服务 进行 服务 注册 时 ， 它 的 class 
文件 将 从 服务 供应 商 指 定 的 代码 库 中 下 载 。JINI 实现 了 一 个 自发 的 网 络 互联 ， 在 这 个 网 络 
中 ， 客 户 机 进入 一 个 新 的 环境 查找 并 访问 本 地 可 用 服务 ， 因 此 ，JINI 服务 的 客户 机 可 能 会 
遇 到 来 自 不 可 靠 来 源 的 服务 对 象 。 如 果 没 有 任何 安全 机 制 ， 这 些 代 码 自动 下 载 的 模式 为 恶 
意 代码 的 发 布 提 供 了 方便 的 途径 。 通 过 Java 安全 机 制 使 Java 适合 于 网 络 应 用 项 目 ， 为 它 
们 建立 安全 的 网 络 移动 代码 提供 了 必要 的 可 信 机 制 。 

Java 安全 模型 则 主要 用 于 保护 终端 用 户 免 受 从 网 络 下 载 的 ， 来 自 不 可 靠 来 源 的 、 恶 意 
程序 的 侵犯 。 为 了 达到 这 个 目的 ，Java 提供 了 一 个 用 户 可 配置 的 “ 沙 箱 ”， 在 沙 箱 中 可 以 
放置 不 可 靠 的 Java 程序 。 沙 箱 对 不 可 靠 程序 的 活动 进行 了 限制 ， 程 序 可 以 在 沙 箱 的 安全 边 
界 内 做 任何 事 ， 但 是 不 能 进行 任何 跨越 这 些 边界 的 举动 。 例 如 ， 原 来 在 版 本 1.0 中 的 沙 箱 
对 很 多 不 可 靠 Java Applet 的 活动 做 了 限制 ， 主 要 包括 : 

口 ” 对 本 地 硬盘 的 读 写 操作 。 

口 ”进行 任何 网 络 连 接 ， 但 不 能 连接 到 提供 者 applet 的 源 主机 。 

口 ” 创 建新 的 进程 。 

口 ”装载 新 的 动态 链接 库 。 

由 于 下 载 的 代码 不 可 能 进行 这 些 特定 的 操作 ， 这 使 得 Java 安全 模型 可 以 保护 终端 用 户 
避免 受到 有 漏洞 的 代码 的 威胁 。 在 沙 箱 内 有 严格 的 限制 ， 其 安全 模型 甚至 规定 了 对 不 可 靠 
代码 能 做 什么 、 不 能 做 什么 ， 所 以 用 户 可 以 比较 安全 地 运行 不 可 靠 代 码 。 但 是 对 于 1.0 系 
统 的 程序 员 和 用 户 来 说 ， 这 个 最 初 的 沙 箱 限制 太 过 严格 ， 善 意 的 代码 常常 无 法 进行 有 效 的 
工作 。 所 以 在 后 来 的 1.1 版 本 中 ， 对 最 初 的 沙 箱 模型 进行 了 改进 ， 引 入 了 基于 代码 签名 和 
认证 的 信任 模式 。 签 名 和 认证 使 得 接收 端 系统 可 以 确认 一 系列 class 文件 已 经 由 某 一 实体 
进行 了 数字 签名 (有 效 ， 可 被 信赖 )。 并 且 在 经 过 签名 处 理 以 后 ，class 文件 没有 改动 。 这 使 
得 终端 用 户 和 系统 管理 员 减 少 了 对 某 些 代码 在 沙 箱 中 的 限制 ， 但 这 些 代码 必须 已 由 可 信任 
团体 进行 数字 签名 。 

虽然 1.1 版 本 的 安全 API 包含 了 对 认证 的 支持 ， 但 是 其 实 只 是 提供 了 完全 信任 和 完全 
不 信任 策略 。Java 1.2 提供 的 API 可 以 帮助 建立 细 粒 度 的 安全 策略 ， 这 种 策略 是 建立 在 数 
字 签 名 代码 的 认证 基础 上 的 。Java 安全 模型 的 发 展 经 历 了 1.0 版 本 的 基本 沙 箱 ， 然 后 是 1.1 
版 本 的 代码 签名 和 认证 ， 最 后 是 1.2 版 以 后 的 细 粒 度 访问 控制 。 
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3.2 ” 沙 箱 模 型 的 4 种 组 件 


在 计算 机 世界 ， 在 个 人 电脑 中 运行 一 个 软件 的 前 提 是 必须 信任 它 。 普 通用 户 只 能 通过 
小 心地 使 用 来 自 可 信任 来 源 的 软件 来 达到 安全 性 ， 并 且 定 期 扫描 ， 检 查 病 毒 来 确保 安全 
性 。 一 旦 某 个 软件 有 权 使 用 我 们 的 系统 ， 那 么 它 将 拥有 对 这 台电 脑 的 完全 控制 权 。 如 果 这 
个 软件 是 恶意 的 ， 那 么 它 就 可 以 为 所 欲 为 。 所 以 在 传统 的 安全 模式 中 ， 必 须 想 办 法 防止 恶 
意 代 码 有 权 使 用 你 的 计算 机 。 


3.2.1 小 箱 模 型 介绍 


沙 箱 安全 模型 使 得 工作 变 得 容易 ， 即 使 某 个 软件 来 自我 们 不 能 完全 信任 的 地 方 ， 通 过 
沙 箱 模 型 可 以 使 我 们 接受 来 自任 何 来 源 的 代码 ， 而 不 是 要 求 用 户 避 免 将 来 自 不 信任 站 点 的 
代码 下 载 到 机 器 上 。 当 运行 来 自 不 可 靠 来 源 的 代码 时 ， 沙 箱 会 限制 它 进行 任何 可 能 破坏 系 
统 的 动作 指令 。 并 且 在 整个 过 程 中 ， 无 需 我 们 指出 哪些 代码 可 以 信任 ， 哪 些 代码 不 可 以 信 
任 ， 也 不 必 扫 描 查 找 病毒 。 沙 箱 本 身 限制 了 下 载 的 任何 病毒 或 其 他 恶意 的 ， 有 漏洞 的 代 
码 ， 使 得 它们 不 能 对 计算 机 进行 破坏 。 

如 果 你 还 有 疑问 ， 在 确信 它 能 保护 你 之 前 ， 用 户 必 需 确认 沙 箱 没 有 任何 漏洞 。 为 了 保 
证 沙 箱 没有 漏洞 ，Java 安全 模型 对 其 体系 结构 的 各 方面 都 进行 了 考虑 。 如 果 在 Java 体系 结 
构 中 有 任何 没有 考虑 到 安全 的 区 域 ， 恶 意 的 程序 员 很 可 能 会 利用 这 些 区 域 来 绕 开 沙 箱 。 
此 ， 为 了 对 沙 箱 有 一 个 了 解 ， 我 们 必须 先 看 一 下 Java 体系 结构 的 几 个 不 同 部 分 ， 并 且 理 解 
它们 是 怎样 一 起 工作 的 。 

下 面 是 组 成 Java 沙 箱 的 基本 组 件 。 

口 “ 类 加 载体 系 结构 。 

口 “class 文件 检验 器 。 

口 ”内置 于 Java 虚拟 机 (及 语言 ) 的 安全 特性 。 

口 ”安全 管理 器 及 Java API。 

Java 的 上 述 安 全 模型 的 前 三 个 部 分 一 一 类 加 载体 系 结构 、class 文件 检验 器 、Java 虚拟 
机 (及 语言 ) 的 安全 特性 一 起 达到 一 个 共同 的 目的 : 保持 Java 虚拟 机 的 实例 和 它 正 在 运行 的 
应 用 程序 的 内 部 完整 性 ， 使 得 它们 不 被 下 载 的 恶意 代码 或 有 漏洞 的 代码 侵犯 。 相 反 ， 这 个 
安全 模型 的 第 四 个 组 成 部 分 是 安全 管理 器 ， 它 主要 用 于 保护 虚拟 机 的 外 部 资源 不 被 虚拟 机 
内 运行 的 恶意 或 有 漏洞 的 代码 侵犯 。 这 个 安全 管理 器 是 一 个 单独 的 对 象 ， 在 运行 的 Java 虚 
拟 机 中 ， 它 在 对 于 外 部 资源 的 访问 控制 起 中 枢 作 用 。 


3.2.2 ”类 加 载体 系 结构 


类 加 载 器 要 加 载 一 个 类 ， 它 首先 检查 此 类 是 否 已 被 加 载 ， 然 后 再 委托 双亲 加 载 器 加 载 
此 类 ， 它 的 双亲 加 载 器 再 委托 它 的 双亲 ， 这 样 一 直 委 托 到 启动 加 载 器 ， 启 动 加 载 器 再 从 核 
心 API 查找 此 类 ， 如 果 有 就 返回 此 类 ， 和 否则 它 的 子 加 载 器 就 查找 此 类 ， 如 果 都 没有 就 抛 出 
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ClassNotFound 的 异常 。 

这 种 委托 双亲 模式 的 好 处 是 : 启动 类 加 载 器 可 以 抢 在 标准 扩展 类 装载 器 之 前 去 装载 
类 ， 而 标准 扩展 类 装载 器 可 以 抢 在 类 路 径 加 载 器 之 前 去 装载 那个 类 ， 类 路 径 装 载 器 又 可 以 
抢 在 自 定义 类 加 载 器 之 前 去 加 载 它 。 所 以 Java 虚拟 机 先 从 最 可 信 的 Java 核心 API 查找 类 
型 ， 这 是 为 了 防止 不 可 靠 的 类 扮演 被 信任 的 类 。 假 设 网 络 上 有 一 个 名 为 java.lang.Integer 的 
类 ， 它 是 某 个 黑客 为 了 想 混 进 java.lang 包 所 起 的 名 字 ， 实 际 上 里 面 含有 恶意 代码 ， 但 是 这 
种 伎俩 在 双亲 模式 加 载体 系 结构 下 是 行 不 通 的 ， 因 为 网 络 类 加 载 器 在 加 载 它 的 时 候 ， 首 先 
调用 双亲 类 加 载 器 ， 这 样 一 直 向 上 委托 ， 直 到 启动 类 加 载 器 ， 而 启动 类 加 载 器 在 核心 
Java API 里 发 现 了 这 个 名 字 的 类 ， 所 以 它 就 直接 加 载 Java 核心 API 的 java.lang.Integer 
类 ， 然 后 将 这 个 类 返回 ， 所 以 自始至终 网 络 上 的 java.lang.Integer 的 类 是 不 会 被 加 载 的 。 

但 是 如 果 这 个 移动 代码 不 是 去 试图 蔡 换 一 个 被 信任 的 类 (就 是 前 面 说 的 那 种 情况 )， 而 
是 想 在 一 个 被 信任 的 包 中 插入 一 个 全 新 的 类 型 ， 情 况 会 怎样 呢 ? 比如 一 个 名 为 
java.lang.Virus 的 类 ， 经 过 双亲 委托 模式 ， 最 终 类 装载 器 试图 从 网 络 上 下 载 这 个 类 ， 因 为 网 
络 类 装载 器 的 双亲 们 都 没有 这 个 类 (当然 没有 了 ， 因 为 是 病毒 吗 )。 假 设 成 功 下 载 了 这 个 
类 ， 那 你 肯定 会 想 ，Virus 和 lang 下 的 其 他 类 都 保存 在 java.lang 包 下 ， 暗 示 这 个 类 是 Java 
API 的 一 部 分 ， 那 么 是 不 是 也 拥有 修改 Java.lang 包 中 数据 的 权限 呢 ? 答案 当然 不 是 ， 因 为 
要 取得 访问 和 修改 java.lang 包 中 的 权限 ，java.lang.Virus 和 java.lang 下 的 其 他 类 必须 是 属 
于 同一 个 运行 时 包 的 。 运 行 时 包 是 指 由 同一 个 类 装载 器 装载 的 、 属 于 同一 个 包 的 、 多 个 类 
型 的 集合 。javalang.Virus 和 javalang 下 的 其 他 类 不 是 同一 个 类 装载 器 装载 的 ， 
java.lang.Virus 是 由 网 络 类 装载 器 装载 的 。 

在 Java 沙 箱 中 ， 类 装载 器 体系 结构 是 第 一 道 防线 。 类 装载 器 体系 结构 在 以 下 三 方面 对 
Java 的 沙 箱 起 作用 。 

(1) 防止 恶意 代码 去 干涉 善意 的 代码 ; 

(2) 守护 了 被 信任 的 类 库 的 边界 ; 

(3) 将 代码 归 入 某 类 ， 该 类 确定 了 代码 可 以 进行 哪些 操作 。 

类 装载 器 体系 结构 可 以 防止 恶意 的 代码 去 干涉 善意 的 代码 ， 这 是 通过 为 由 不 同 的 类 装 
载 器 装 入 的 类 提供 不 同 的 命名 空间 来 实现 的 。 命 名 空间 由 一 系列 唯一 的 名 称 组 成 ， 每 一 个 
被 装载 的 类 有 一 个 名 字 ， 这 个 命名 空间 是 由 Java 虚拟 机 为 每 一 个 类 装载 器 维护 的 。 例 如 ， 
一 旦 Java 虚拟 机 将 一 个 名 为 Volcano 的 类 装 入 一 个 特定 的 命名 空间 ， 它 就 不 能 再 装载 名 为 
Volcanno 的 其 他 类 到 相同 的 命名 空间 了 。 可 以 把 多 个 Volcanno 类 装 入 一 个 Java 虚拟 机 
中 ， 因 为 可 以 通过 创建 多 个 类 装载 器 在 一 个 Java 应 用 程序 中 创建 多 个 命名 空间 。 如 果 在 一 
个 运行 的 Java 应 用 程序 中 创建 了 三 个 独立 的 命名 空间 (为 三 个 类 装载 器 中 的 每 一 个 都 创建 
一 个 命名 空间 )， 就 可 以 通过 为 每 个 命名 空间 装载 一 个 Volcano 类 ， 从 而 满足 将 三 个 不 同 的 
Volcano 类 装载 到 应 用 陈 旭 中 的 要 求 。 

通过 命名 空间 可 以 帮助 安全 的 实现 ， 因 为 我 们 可 以 有 效 地 在 装 入 不 同 命名 空间 的 类 之 
间 设 置 一 个 防护 罩 。 在 Java 虚拟 机 中 ， 在 同一 个 命名 空间 中 的 类 可 以 直接 进行 交互 。 除 非 
显 式 地 提供 允许 它们 进行 交互 的 机 制 ， 否 则 在 不 同 的 命名 空间 中 的 类 甚至 不 会 察觉 彼此 的 
存在 。 一 旦 加 载 后 ， 如 果 一 个 恶意 的 类 被 赋予 权限 访问 其 他 虚拟 机 加 载 的 当前 类 ， 它 就 可 
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以 潜在 地 知道 一 些 它 不 应 该 知道 的 信息 ， 或 者 干扰 程序 的 正常 运行 。 

类 装载 器 体系 结构 守护 了 被 信任 的 类 库 的 边界 ， 这 是 通过 分 别 使 用 不 同 的 类 装载 器 装 
载 可 靠 的 包 和 不 可 靠 的 包 来 实现 的 。 虽 然 通过 赋 给 成 员 受 保护 的 访问 限制 ， 可 以 在 同一 个 
包 中 的 类 型 间 授 予 彼此 访问 的 特殊 权限 ， 但 这 种 特殊 的 权限 只 能 授 给 在 同一 个 包 中 的 运行 
时 成 员 ， 而 且 它们 必须 是 由 同一 个 类 装载 器 装载 的 。 

用 户 自 定义 类 装载 器 经 常 依赖 于 其 他 类 装载 器 ， 至 少 依赖 于 虚拟 机 启动 时 创建 的 启动 
类 装载 器 ， 类 可 以 帮助 它 实 现 一 些 类 装载 请 求 。 在 1.2 版 本 以 前 ， 非 启动 类 装载 器 必须 显 
式 地 求助 于 其 他 类 装载 器 ， 类 装载 器 可 以 请 求 另 一 个 用 户 自 定义 的 类 装载 器 来 装载 类 ， 这 
个 请 求 是 通过 对 被 请 求 的 用 户 自 定义 类 装载 器 调用 loadClass() 来 实现 的 。 除 此 之 外 ， 类 装 
载 器 也 可 以 通过 调用 findSystemClass() 来 请 求 启动 类 装载 器 来 装载 类 ， 这 是 类 ClassLoader 
中 的 一 个 静态 方法 。 在 1.2 版 本 中 ， 类 装载 器 请 求 另 一 个 类 装载 器 来 装载 类 型 的 过 程 被 形 
式 化 ， 成 为 双亲 委派 模式 。 从 1.2 版 本 开始 ， 除 启动 类 装载 器 意外 的 每 一 个 类 装载 器 ， 都 
有 一 个 “双亲 ”类 装载 器 ， 在 某 个 特定 的 类 装载 器 试图 以 常用 方式 装载 类 型 以 前 ， 它 会 先 
默认 地 将 这 个 任务 “委派 ”给 它 的 双亲 ， 目 的 是 请 求 它 的 双亲 来 装载 这 个 类 型 。 这 个 双亲 
再 一 次 请 求 它 自己 的 双亲 来 装载 这 个 类 型 。 这 个 委派 的 过 程 一 直 向 上 继续 ， 直 到 达到 启动 
类 装载 器 ， 通 常 启动 类 装载 器 是 委派 链 中 的 最 后 一 个 类 装载 器 。 如 果 一 个 类 装载 器 的 双亲 
类 装载 器 有 能 力 来 装载 这 个 类 型 ， 则 这 个 类 装载 器 返回 这 个 类 型 。 否 则 这 个 类 装载 器 试图 
自己 来 装载 这 个 类 型 。 

在 1.2 版 本 以 前 的 大 多 数 虚拟 机 中 ， 内 置 的 类 装载 器 负责 在 本 地 装载 可 用 的 class 文 
件 。 这 些 class 文件 通常 包括 如 下 元 素 : 

口 ” 要 运行 的 Java 应 用 程序 的 class 文件 。 

口 ” 此 应 用 程序 所 需要 的 任何 类 库 。 

口 ” 在 这 些 类 库 中 包含 JavaAPI 的 基本 class 文件 。 

要 想 找 到 上 述 三 类 被 请 求 类 型 的 class 文件 ， 需 要 分 析 具 体 实现 细节 来 实现 。 尽 管 如 
此 麻烦 ， 但 是 许多 实现 都 是 按照 类 路 径 (Classpath) 指 明 的 顺序 查找 目录 和 Jar 文件 的 。 

在 1.2 后 面 的 版 本 中 ， 装 载 本 地 可 用 的 class 文件 的 工作 被 分 配 到 多 个 类 装载 器 中 ， 刚 
才 称 为 原始 类 装载 器 的 内 置 的 类 装载 器 被 重新 命名 为 启动 类 装载 器 ， 这 表示 它 现在 只 负责 
装载 那些 核心 Java API 的 class 文件 。 因 为 核心 Java API 的 class 文件 是 用 于 “启动 ”Java 
虚拟 机 的 class 文件 ， 所 以 启动 类 装载 器 的 名 字 也 因此 而 得 。 

在 1.2 后 面 的 版 本 中 ， 通 过 用 户 自 定义 类 装载 器 负责 其 他 class 文件 的 装载 ， 例 如 实现 
应 用 程序 运行 的 class 文件 ， 实 现 安装 或 下 载 标准 扩展 的 class 文件 等 。 当 1.2 版 本 的 Java 
虚拟 机 开始 运行 时 ， 在 应 用 程序 启动 以 前 ， 会 至 少 创建 一 个 用 户 自 定 义 类 装载 器 ， 很 有 可 
能 会 创建 多 个 。 所 有 这 些 类 装载 器 被 连接 在 一 个 “双亲 -孩子 ”的 关系 链 中 ， 在 这 条 链 的 
顶端 是 启动 类 装载 器 ， 在 这 条 链 的 末端 是 一 个 在 1.2 版 本 中 被 称 为 “系统 类 装载 器 ”的 类 
装载 器 。 在 1.2 版 本 以 前 ，“ 系 统 类 装载 器 ”这 个 名 字 有 时 指 内 置 的 类 装载 器 ， 它 也 被 称 
作 原 始 类 装载 器 。 在 1.2 版 本 中 ， 系 统 类 装载 器 这 个 名 字 有 了 更 正式 的 定义 ， 它 是 指 由 
Java 应 用 程序 创建 的 ， 新 的 用 户 定义 类 装载 器 的 默认 委派 双亲 。 这 个 默认 的 委派 双亲 通常 
是 一 个 用 户 自 定义 的 类 装载 器 ， 它 装载 应 用 程序 的 初始 类 ， 但 是 它 也 可 能 是 任何 用 户 自 定 
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义 的 类 装载 器 ， 这 是 由 实现 Java 平台 的 设计 者 决定 的 。 

例如 一 个 Java 应 用 程序 装载 了 一 个 类 装载 器 ， 这 个 装载 器 是 通过 网 络 下 载 来 装载 
class 文件 的 。 假 如 我 们 在 虚拟 机 上 运行 这 个 应 用 程序 ， 在 启动 时 实例 化 了 如 下 两 个 用 户 自 
定义 类 装载 器 。 

口 一 个 “已 安装 扩展 ”的 类 装载 器 。 

口 一 个 “类 路 径 ” 类 装载 器 。 

上 述 类 装载 器 和 启动 类 装载 器 一 起 连 入 一 个 双亲 -孩子 关系 链 中 ， 如 图 3-1 所 示 。 类 路 
径 的 类 装载 器 的 双亲 是 已 安装 了 扩展 的 类 装载 器 ， 而 它 的 双亲 是 启动 类 装载 器 ， 在 图 3-1 
中 ， 类 路 径 装载 器 被 设计 成 系统 类 装载 器 ， 新 的 用 户 自 定义 类 装载 器 的 默认 委派 双亲 被 应 
用 程序 实例 化 。 假 设 当 应 用 程序 实例 化 它 的 网 络 类 装载 器 时 ， 它 指明 了 系统 类 装载 器 作为 
它 的 双亲 。 


启动 类 装 才 器 [| 


[| 


标准 扩展 类 装载 器 。 一 一 一 一 


路 径 类 装载 器 一 


网 络 类 装载 器 


图 3-1 “双亲 -孩子 ”类 装载 器 委派 链 


假设 在 运行 Java 程序 的 过 程 中 ， 类 装载 器 发 出 一 个 装载 Volcano 类 的 请 求 ， 类 装载 器 
必须 先 询问 它 的 双亲 一 一 类 路 径 类 装载 器 ， 然 后 查找 并 装载 这 个 类 。 这 个 类 路 径 类 装载 器 
依次 将 向 它 自 己 的 双亲 发 出 同样 的 请 求 ， 它 的 双亲 即 为 安装 扩展 的 类 装载 器 。 这 个 类 装载 
器 也 是 首先 将 这 个 请 求 委 派 给 它 自己 的 双亲 一 一 启动 类 装载 器 。 假 设 Volcano 类 不 是 Java 
API 的 一 部 分 ， 也 不 是 一 个 已 安装 扩展 的 一 部 分 ， 也 不 在 类 路 径 上 ， 所 有 这 些 类 装载 器 将 
返回 而 不 会 提供 一 个 名 为 Volcanno 的 已 装载 类 。 当 类 路 径 装载 器 回答 ， 它 和 所 有 它 的 双亲 
都 不 能 装载 这 个 类 时 ， 你 的 类 装载 器 可 能 将 试图 用 它 自 己 特定 的 方式 来 装载 Volcano 类 ， 
它 会 通过 网 络 下 载 Volcano。 假 设 你 的 类 装载 器 可 以 下 载 类 Volcano， 这 样 类 Volcano 就 可 
以 在 应 用 程序 以 后 的 执行 过 程 中 发 挥 作用 。 假 设 在 以 后 的 某 一 时 刻 类 Volcano 的 一 个 方法 
首次 被 调用 ， 并 且 那 个 方法 引用 了 Java API 中 的 类 java.utiLHashMap， 因 为 这 个 引用 是 首 
次 被 运行 的 程序 使 用 ， 所 以 虚拟 机 会 请 求 你 的 类 装载 器 (装载 Volcano 的 类 装载 器 ) 来 装载 
java.util.HashMap。 就 像 以 前 一 样 ， 我 们 的 类 装载 器 首先 将 请 求 传 递 给 它 的 双亲 类 装载 器 ， 
然后 这 个 请 求 一 路 委派 ， 直 到 委派 给 启动 类 装载 器 。 但 是 这 次 ， 启 动 类 装载 器 可 以 将 
java.util.HashMap 类 返回 给 你 的 类 装载 器 ， 因 为 启动 类 装载 器 可 以 找到 这 个 类 ， 所 以 已 安 
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装 扩展 的 类 装载 器 就 不 必 在 已 安装 扩展 中 查找 这 个 类 型 ， 类 路 径 类 装载 器 也 不 必 在 类 路 径 
中 查找 这 个 类 型 ， 同 样 我 们 的 类 装载 器 也 不 必 从 网 上 下 载 这 个 类 。 所 有 这 些 类 装载 器 仅 需 
要 返回 由 启动 类 装载 器 返回 的 类 java.util.HashMap。 从 这 时 开始 ， 无 论 类 Volcano 何 时 引 
用 名 为 java.util.HashMap 的 类 ， 虚 拟 机 就 可 以 直接 使 用 这 个 java.util.Hashmap 类 了 。 

综 上 所 述 ， 类 装载 器 的 体系 结构 是 通过 剔除 装 作 被 信任 的 不 可 靠 类 来 保护 可 信任 类 库 
的 边界 的 。 如 果 某 个 恶意 的 类 可 以 成 功 地 欺骗 Java 虚拟 机 ， 使 Java 虚拟 机 相信 它 是 一 个 
来 自 Java API 的 可 信任 类 ， 那 么 这 个 恶意 的 类 可 能 突破 沙 箱 的 阻隔 。 为 了 防止 不 可 靠 的 类 
扮演 被 信任 的 类 ， 类 装载 器 的 体系 结构 阻塞 了 危及 Java 运行 时 安全 的 潜在 途径 。 

在 有 双亲 委派 模式 的 情况 下 ， 启 动 类 装载 器 可 以 抢 在 标准 扩展 类 装载 器 之 前 去 装载 
类 ， 而 标 桩 扩展 类 装载 器 可 以 抢 在 类 路 径 装载 器 之 前 去 装载 那个 类 ， 类 路 径 装 载 器 又 可 以 
抢 在 网 络 类 装载 器 之 前 去 装载 它 。 这 样 ， 在 使 用 双亲 -孩子 委派 链 的 方法 中 ， 启 动 类 装载 
器 会 在 最 可 信 的 类 库 “ 核 心 JavaAPI” 中 首先 检查 每 个 被 装载 的 类 型 ， 然 后 依次 到 标准 扩 
展 ， 类 路 径 上 的 本 地 类 文件 中 检查 。 所 以 ， 如 果 网 络 类 装载 器 装载 的 某 段 移动 代码 发 出 指 
示 ， 试 图 通过 网 络 下 载 一 个 和 JavaAPI 中 某 个 类 型 同名 的 类 型 ， 例 如 java.lang.Integer， 它 
将 不 能 取得 成 功 。 如 果 java.lang.Interger 的 class 文件 在 JavaAPI 中 已 经 存在 ， 它 将 被 启动 
类 装载 器 抢先 装载 ， 而 网 络 类 装载 器 将 没有 机 会 下 载 并 定义 名 为 java.lang.Integer 的 类 ， 它 
只 能 使 用 由 它 的 双亲 返回 的 类 ， 这 个 类 应 该 是 由 启动 类 装载 器 装载 的 。 用 这 种 方法 ， 类 装 
载 器 的 体系 结构 可 以 防止 不 可 靠 的 代码 用 它们 自己 的 版 本 蔡 代 可 信任 的 类 。 

再 次 做 一 个 假设 ， 如 果 这 个 移动 代码 不 是 去 试图 替换 一 个 被 信任 的 类 ， 而 是 想 在 一 个 
被 信任 的 包 中 插入 一 个 全 新 的 类 型 ， 情 况 会 怎样 呢 ? 如 果 在 刚才 那个 例子 中 ， 要 求 网 络 类 
装载 器 装载 一 个 名 为 java.lang.Virus 的 类 时 。 像 以 前 一 样 ， 这 个 请 求 将 首先 被 一 路 向 上 委 
派 给 启动 类 装载 器 ， 虽 然 这 个 启动 类 装载 器 负责 装载 核心 JavaAPI 的 class 文件 ， 包 括 包 
java.lang， 但 是 它 无 法 在 包 java.lang 中 找到 名 为 Virus 的 成 员 。 假 设 这 个 类 在 已 安装 扩展 
以 及 本 地 类 路 径 中 也 找 不 到 ， 我 们 的 类 装载 器 将 试图 从 网 络 上 下 载 这 个 类 。 

假设 我 们 的 类 装载 器 成 功 下 载 并 定义 了 名 为 java.lang.Virus 的 类 ， 则 Java 允许 在 同一 
个 包 中 的 类 拥有 彼此 访问 的 特殊 权限 ， 而 在 此 包 之 外 的 类 则 没有 这 个 权限 。 因 为 我 们 的 类 
装载 器 装载 了 一 个 名 为 java.lang.Vims 的 类 ， 则 表示 这 个 类 是 Java API 的 一 部 分 ， 它 会 得 
到 访问 java.lang 中 被 信任 类 的 特殊 访问 权限 ， 并 且 可 以 使 用 这 个 特殊 的 访问 权限 达到 不 可 
告 人 的 目的 。 类 装载 机 制 可 以 防止 这 个 代码 得 到 访问 java.lang 包 中 被 信任 类 的 访问 权限 ， 
因为 Java 虚拟 机 只 把 彼此 访问 的 特殊 权限 授予 由 同一 个 类 装载 器 装载 到 同一 个 包 中 的 类 
型 。 因 为 Java API 的 包 javalang 中 被 信任 类 是 由 启动 类 装载 器 装载 的 ， 而 恶意 的 类 
java.lang.Virus 是 由 网 络 类 装载 器 装载 的 ， 所 以 这 些 类 型 不 属于 同一 个 运行 时 包 。 运 行 时 包 
这 个 名 词 ， 是 在 Java 虚拟 机 第 2 版 规范 中 第 一 次 出 现 的 ， 它 指 由 同一 个 类 装载 器 装载 的 ， 
属于 同一 个 包 的 多 个 类 型 的 集合 。 在 允许 两 个 类 型 之 间 对 包 内 可 见 的 成 员 进行 访问 前 ， 虚 
拟 机 不 但 要 确定 这 两 个 类 型 属于 同一 个 包 ， 还 必须 确认 它们 属于 同一 个 运行 时 包 一 一 它们 
必须 是 由 同一 个 类 装载 器 装载 的 。 这 样 因为 java.lang.Virus 和 来 自 核心 JavaAPI 的 java。 
Lang 的 成 员 不 属于 同一 个 运行 时 包 ，java.lang.Virus 就 不 能 访问 JavaAPI 和 java.lang 保重 
的 类 型 和 包 内 可 见 的 成 员 。 
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之 所 以 提出 运行 时 包 的 概念 ， 目 的 之 一 是 使 用 不 同 的 类 装载 器 装载 不 同 的 类 。 启 动 类 
装载 器 装载 核心 JavaAPI 的 class 文件 ， 这 些 class 文件 是 最 可 信 的 。 已 安装 扩展 的 类 装载 
器 装载 来 自 于 任何 已 安装 扩展 的 class 文件 ， 已 安装 扩展 是 非常 可 信 的 ， 但 这 个 可 信 度 是 
在 一 定 程度 上 的 可 信 度 ， 它 们 不 能 简单 地 通过 将 新 类 型 插入 到 JavaAPI 的 包 中 来 获得 对 包 
内 可 见 成 员 的 访问 权 ， 这 是 因为 已 安装 扩展 是 由 不 同 于 核心 API 的 类 装载 器 装载 的 。 同 
样 ， 由 类 路 径 类 装载 器 在 类 路 径 中 发 现 的 代码 不 能 访问 已 安装 扩展 或 JavaAPI 中 的 包 内 可 
见 成 员 。 

类 装载 器 可 以 使 用 另 一 种 方法 来 保护 被 信任 的 类 库 边 界 ， 它 只 需 通过 简单 地 拒绝 装载 
特定 的 禁止 类 型 就 可 以 了 。 例 如 ， 我 们 可 能 已 经 安装 了 一 些 包 ， 在 这 些 包 中 包含 了 应 用 程 
序 需 要 装载 的 类 ， 这 些 类 必须 是 由 网 络 类 装载 器 的 双亲 “类 路 径 装 载 器 ”来 装载 的 ， 而 不 
是 由 网 络 类 装载 器 来 装载 的 。 假 设 已 经 创建 了 一 个 名 为 absolutepower 的 包 ， 并 且 将 它 安装 
在 本 地 类 路 径 中 的 某 个 地 方 ， 在 这 里 它 可 以 被 类 路 径 类 装载 器 访问 到 。 而 且 假 设 你 不 想 让 
由 自己 的 类 装载 器 装载 的 类 ， 能 装载 来 自 absolutepower 包 中 的 任何 类 。 在 这 种 情况 下 ， 必 
须 编写 自己 的 类 装载 器 ， 让 它 做 的 第 一 件 事 就 是 确认 被 请 求 的 类 不 是 absolutepower 包 中 的 
一 个 成 员 。 如 果 这 样 的 类 被 请 求 装载 ， 你 的 类 装载 器 将 抛 出 一 个 安全 异常 ， 而 不 是 将 这 个 
类 的 名 字 传 给 双亲 类 装载 器 。 

类 装载 器 要 知道 一 个 类 是 否 来 源 已 一 个 被 禁止 的 包 ， 例 如 absolutepower， 唯 一 的 方法 
是 通过 它 的 类 名 来 检测 。 因 为 类 名 absolutepower.FancyClassLoader 指明 了 它 是 包 
absolutepower 的 一 部 分 ， 而 包 absolutepower 被 列 在 被 禁止 的 包 列 表 中 ， 所 以 的 类 装载 器 应 
该 立即 抛 出 一 个 安全 异常 。 

除了 屏蔽 不 同 命名 空间 中 的 类 并 保护 被 信任 的 类 库 的 边界 外 ， 类 装载 器 还 有 另外 的 安 
全 作用 。 类 装载 器 必须 将 每 一 个 被 装载 的 类 放置 在 一 个 保护 域 中 ， 一 个 保护 域 定义 了 这 个 
代码 在 运行 时 将 得 到 怎样 的 权限 。 这 是 类 装载 器 的 一 个 非常 重要 的 安全 工作 。 


3.2.3 class 文件 检验 器 


class 文件 检验 器 的 功能 是 ， 保 证 类 装载 器 装载 的 class 文件 内 容 有 正确 的 内 部 结构 ， 
并 且 这 些 class 文件 相互 间 协 调 一 致 。 如 果 class 文件 检验 器 在 class 文件 中 发 现 问题 时 会 抛 
出 异常 。 好 的 Java 编译 器 不 应 该 产生 畸形 的 class 文件 ， 但 是 Java 虚拟 机 并 不 知道 某 个 特 
定 的 class 文件 是 如 何 被 创建 的 。 因 为 一 个 class 文件 实质 上 是 一 个 字 节 序列 ， 所 以 虚拟 机 
无 法 分 辨 特定 的 class 文件 是 由 正常 的 Java 编译 器 产生 的 ， 还 是 由 黑客 打造 的 ， 因 为 黑客 
可 能 威胁 虚拟 机 的 完整 性 。 所 以 ， 所 有 的 Java 虚拟 机 的 实现 必须 有 一 个 class 文件 检验 
器 ， 文 件 检验 器 可 以 调用 class 文件 以 确保 这 些 定义 的 类 型 可 以 安全 的 使 用 。 

健壮 性 是 class 文件 检验 器 实现 的 安全 目标 之 一 。 如 果 某 个 有 漏洞 的 编译 器 或 比较 牛 
黑客 产生 了 一 个 class 文件 ， 而 在 这 个 class 文件 中 包含 了 一 个 方法 ， 在 这 个 方法 的 字 节 码 
中 包含 了 一 条 跳 转 到 方法 之 外 的 指令 ， 那 么 一 旦 调用 这 个 方法 ， 则 会 导致 虚拟 机 崩溃 的 结 
果 。 正 因为 如 此 ， 所 以 出 于 健壮 性 的 考虑 ， 迫 切 需要 虚拟 机 检验 它 装 载 的 字 节 码 是 否 
完整 。 

Java 虚拟 机 的 class 文件 检验 器 在 字 节 码 执 行 之 前 ， 必 须 完成 大 部 分 检验 工作 。 它 只 
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在 执行 前 而 不 是 在 执行 中 对 字 节 码 进行 一 次 分 析 ( 并 验证 它 的 完整 性 )， 每 一 次 遇 到 一 个 跳 
转 指令 时 都 进行 检验 。 作 为 字 节 码 确认 工作 的 一 部 分 ， 虚 拟 机 将 确认 所 有 的 跳 转 指令 会 到 
达 另 一 条 合法 的 指令 ， 而 且 这 条 指令 是 在 这 个 方法 的 字 节 码 流 中 。 在 大 多 数 情况 下 ， 在 执 
行 前 就 对 所 有 字 节 码 进 行 一 次 检查 ， 对 于 保证 健壮 性 来 说 就 够 了 ， 而 不 必 在 它 运行 时 每 次 
都 检验 每 一 条 字 节 码 指令 。 

class 文件 检验 器 要 进行 如 下 四 趟 独立 的 扫描 来 完成 它 的 操作 。 

口 第 一 趟 扫描 时 在 类 被 装载 时 进行 的 ， 在 这 次 扫描 中 ，class 文件 检验 器 检查 这 个 

class 文件 的 内 部 结构 ， 以 保证 它 可 以 被 安全 地 编译 。 

口 第 二 和 第 三 趟 扫描 时 在 连接 过 程 中 进行 的 ， 在 这 两 次 扫描 中 ，class 文件 检验 器 确 

认 类 型 数据 遵从 Java 编程 语言 的 定义 ， 包 括 检验 它 所 包含 的 所 有 字 节 码 的 完 
整 性 。 

口 “ 第 四 趟 扫描 是 在 进行 动态 链接 的 过 程 中 解析 符号 引用 时 进行 的 ， 在 这 次 扫描 中 ， 

class 文件 检验 器 确认 被 引用 的 类 、 字 段 以 及 方法 确实 存在 。 

在 接 下 来 的 内 容 中 ， 将 对 这 四 趟 扫描 的 具体 过 程 进行 详细 讲解 。 

1) 第 一 趟 :class 文件 的 结构 检查 

在 第 一 趟 扫描 中 ， 对 每 一 段 将 被 当 作 类 型 导入 的 字 节 序列 ，class 文件 检验 器 都 会 确认 
它 是 否 符合 Javaclass 文件 的 基本 结构 。 在 这 次 扫描 中 ， 检 验 器 将 进行 许多 检查 ， 例 如 每 个 
class 文件 必须 以 四 个 同样 的 字 节 开始 : 魔 数 0xCAFEBABE。 这 个 魔 数 的 功能 是 让 class 文 
件 分 析 器 很 容易 分 辨 出 某 个 文件 有 明显 问题 而 加 以 拒绝 ， 此 文件 可 能 是 破坏 了 的 class 文 
件 ， 或 者 根本 就 不 是 class 文件 。 这 样 ，class 文件 检验 器 所 做 的 第 一 件 事 可 能 是 检查 导入 
的 文件 是 否 是 以 魔 数 开头 。 检 验 器 还 必须 确认 在 class 文件 中 声明 的 主 版 本 号 和 次 版 本 
号 ， 这 个 版 本 号 必须 在 这 个 Java 逊 尼 基 实 现 可 以 支持 的 范围 之 内 。 

在 第 一 趟 扫描 中 ，class 文件 检验 器 必须 检验 确认 这 个 class 文件 没有 被 删节 ， 尾 部 也 
没有 附带 其 他 的 字 节 。 虽 然 不 同 的 class 文件 有 不 同 的 长 度 ， 但 是 class 文件 中 包含 的 每 一 
个 组 成 部 分 都 声明 了 它 的 长 度 和 类 型 。 检 验 器 可 以 使 用 组 成 部 分 的 类 型 和 长 度 来 确定 整个 
class 文件 的 正确 的 总 长 度 。 用 这 种 方法 ， 它 就 可 以 检查 一 个 装 入 的 文件 ， 其 长 度 是 否 和 它 
里 面 的 内 容 相 一 致 。 

第 一 趟 扫描 的 主要 目的 就 是 保证 这 个 字 节 序列 正确 地 定义 了 一 个 新 类 型 ， 它 必须 遵从 
Java 的 class 文件 的 固定 格式 ， 这 样 它 才能 被 编译 成 在 方法 区 中 的 内 部 数据 结构 。 第 二 、 
第 三 和 第 四 趟 扫描 不 是 在 符合 class 文件 格式 的 二 进 制 数据 上 进行 的 ， 而 是 在 方法 区 中 
的 ， 由 实现 决定 的 数据 结构 上 进行 的 。 

2) 第 二 趟 : 类 型 数据 的 语义 检查 

在 第 二 趟 扫描 中 ， 在 检查 时 class 文件 检验 器 不 需要 查看 字 节 码 ， 也 不 需要 查看 和 装 
载 任何 其 他 类 型 。 在 这 趟 扫描 中 ， 检 验 器 会 查看 每 个 组 成 部 分 ， 确 认 它 们 是 否 是 其 所 属 类 
型 的 实例 ， 它 们 的 结构 是 否 正 确 。 例 如 方法 描述 符 ( 它 的 返回 类 型 ， 以 及 参数 的 类 型 和 个 数 ) 
在 class 文件 中 被 存储 为 一 个 字符 串 ， 这 个 字符 串 必 须 符合 特定 的 上 下 文 无 关 文 法 。 检 验 
器 对 每 个 组 成 部 分 进行 检查 的 目的 之 一 是 ， 为 了 确认 每 个 方法 描述 符 都 是 符合 特定 语法 
的 、 格 式 正 确 的 字符 串 。 
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除 此 之 外 ，class 文件 检验 器 检查 这 个 类 本 身 是 否 符合 特定 的 条 件 ， 它 们 是 由 Java 编 
程 语言 规定 的 。 例 如 ， 检 验 器 强制 规定 除 Object 类 以 外 的 所 有 类 ， 都 必须 有 一 个 超 类 。 在 
第 二 趟 扫描 中 ， 检 验 器 还 要 检查 final( 最 终 的 ) 类 没有 被 子 类 化 ， 而 且 final 方法 没有 被 覆 
盖 。 还 要 检查 常量 池 中 的 条 目 是 合法 的 ， 而 且 常 量 池 的 所 有 索引 必须 指向 正确 类 型 的 常量 
池 条 目 。 也 就 是 说 ，class 文件 检验 器 在 运行 时 检查 了 一 些 Java 语言 应 该 在 编译 时 遵守 的 
强制 规则 。 因 为 检验 器 并 不 确定 class 文件 是 否 是 由 一 个 善意 的 、 没 有 漏洞 的 编译 器 产生 
的 ， 所 以 它 会 检查 每 个 class 文件 ， 以 确保 这 些 规则 得 到 遵守 。 

3) 第 三 趟 : 字 节 码 验 证 

在 class 文件 检验 器 成 功 地 进行 了 前 面 的 两 趟 检查 之 后 ， 接 下 来 开始 把 注意 力 放 在 字 
节 码 上 ， 所 以 第 三 趟 扫描 被 称 为 “ 字 节 码 验证 ”。 在 这 趟 扫描 中 ，Java 虚拟 机 对 字 节 流 进 
行 数据 流 分 析 ， 这 些 字 节 流 代表 的 是 类 的 方法 。 为 了 理解 字 节 码 检验 器 ， 必 须 对 字 节 码 和 
栈 帧 有 一 定 的 了 解 。 

字 节 码 流 代表 了 Java 的 方法 ， 它 是 由 被 称 为 操作 码 的 单字 节 指 令 组 成 的 序列 ， 每 一 个 
操作 码 后 都 跟着 一 个 或 多 个 操作 数 。 操 作 数 用 于 在 Java 虚拟 机 执行 操作 码 指令 时 提供 所 需 
的 额外 的 数据 。 执 行 字 节 码 时 ， 依 次 执行 每 个 操作 码 ， 这 就 在 Java 虚拟 机 内 构成 了 执行 的 
线程 。 每 一 个 线程 被 授予 自己 的 Java 栈 ， 这 个 栈 是 由 不 同 的 栈 帧 构成 的 。 每 一 个 方法 调用 
将 获得 一 个 自己 的 栈 帧 一 一 栈 帧 其 实 就 是 一 个 内 存 片段 ， 其 中 存储 着 局 部 变量 和 计算 的 中 
间 结 果 。 在 栈 帧 中 ， 用 于 存储 方法 的 中 间 结 果 的 部 分 被 称 为 该 方法 的 操作 数 栈 。 操 作 码 和 
它 的 (可 选 的 ) 操 作 数 可 能 指 存储 在 操作 数 栈 中 的 数据 ， 或 存储 在 方法 栈 帧 中 局 部 变量 中 的 
数据 。 这 样 ， 在 执行 一 个 操作 码 时 ， 除 了 可 以 使 用 紧 随 其 后 的 操作 数 ， 虚 拟 机 还 可 以 使 用 
操作 数 栈 中 的 数据 ， 或 局 部 变量 中 的 数据 ， 或 是 两 者 都 用 。 

字 节 码 检验 器 需要 进行 大 量 的 检查 ， 目 的 是 确保 采用 任何 路 径 在 字 节 码 流 中 都 得 到 一 
个 确定 的 操作 码 ， 确 保 操 作 数 栈 总 是 包含 正确 的 数值 以 及 正确 的 类 型 。 它 必须 保证 局 部 变 
量 在 赋予 合适 的 值 以 前 不 能 被 访问 ， 而 且 类 的 字段 中 必须 总 是 被 赋予 正确 类 型 的 值 ， 类 的 
方法 被 调用 时 总 是 传递 正确 数值 和 类 型 的 参数 。 字 节 码 检验 器 还 必须 保证 每 个 操作 码 都 是 
合法 的 ， 即 每 一 个 操作 码 都 有 合法 的 操作 数 ， 以 及 对 每 一 个 操作 码 ， 合 适 类 型 的 数值 位 于 
局 部 变量 中 或 是 在 操作 数 栈 中 。 这 些 仅仅 是 字 节 码 检验 器 所 做 的 大 量 检验 工作 中 的 一 小 部 
分 ， 在 整个 检验 过 程 通过 后 ， 它 就 能 保证 这 个 字 节 码 流 可 以 被 Java 虚拟 机 安全 地 执行 。 

字 节 码 检验 器 并 不 试图 检测 出 所 有 的 安全 问题 。 如 果 要 这 样 的 话 ， 它 将 会 遇 到 “停机 
问题 ”。 停 机 问题 是 计算 机 科学 领域 的 一 个 著名 论题 : 即 不 可 能 写 出 一 个 程序 ， 用 它 来 判 
断 作 为 其 输入 而 读 入 的 某 个 或 层 序 在 执行 时 是 否 停机 。 一 个 程序 是 否 会 停机 被 称 为 是 程序 
的 “不 可 判定 ”特性 ， 因 为 不 可 能 写 出 一 个 程序 ， 让 它 100% 地 告诉 你 任何 一 个 给 定 的 程 
序 是 否 含有 这 种 特性 。 停 机 问题 的 不 可 判定 性 可 以 扩展 成 计算 机 程序 的 许多 特性 ， 如 一 个 
Java 字 节 码 的 集合 是 否 能 被 虚拟 机 安全 地 执行 。 如 果 不 是 ， 那 么 ， 这 些 字 节 码 可 能 可 以 被 
虚拟 机 安全 地 执行 ， 也 可 能 不 能 安全 地 执行 。 这 样 ， 通 过 识别 一 些 安全 的 字 节 码 流 ， 但 不 
是 全 部 ， 检 验 器 就 绕 过 了 停机 问题 。 由 于 字 节 码 检验 器 强制 检查 的 特性 ， 只 要 定义 好 规 
则 ， 任 何 程序 只 要 可 以 用 Java 编程 语言 书写 ， 编 译 器 就 可 以 确保 编译 出 来 的 字 节 码 可 以 被 
检验 器 通过 。 有 些 程序 虽然 不 能 用 Java 编程 语言 源 代码 表达 出 来 ， 但 仍 可 以 通过 检验 器 的 
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检验 。 另 外 还 有 些 程 序 ， 它 们 实际 上 也 能 被 Java 虚拟 机 安全 地 执行 ， 却 不 能 通过 检验 器 的 
检验 。 
在 第 一 、 第 二 和 第 三 趟 扫描 中 ，class 文件 检验 器 能 够 保证 导入 的 class 文件 构成 合 
理 ， 符 合 Java 编程 语言 的 限制 条 件 ， 并 且 包 含 的 字 节 码 可 以 被 Java 虚拟 机 安全 地 执行 。 
如 果 class 文件 检验 器 发 现 其 中 任何 一 点 不 正确 ， 都 会 抛 出 一 个 错误 ， 这 个 class 文件 将 不 
会 被 程序 使 用 。 
4) 第 四 趟 : 符号 引用 的 验证 
在 动态 链接 的 过 程 中 ， 如 果 包 含 在 一 个 class 文件 中 的 符号 引用 被 解析 时 ，class 文件 
检验 器 将 进行 第 四 趟 检查 。 在 第 四 趟 检查 中 ，Java 虚拟 机 将 追踪 那些 引用 一 一 从 被 验证 的 
class 文件 到 被 引用 的 class 文件 ， 以 确保 这 个 引用 是 正确 的 。 因 为 第 四 趟 扫描 必须 检查 被 
检测 的 class 文件 以 外 的 其 他 类 ， 所 以 这 次 扫描 可 能 需要 装载 新 的 类 。 大 多 数 Java 虚拟 机 
的 实现 采用 延迟 装载 类 的 策略 ， 直 到 类 真正 地 被 程序 使 用 时 才 装 载 。 即 使 一 个 实现 确实 预 
先 装载 了 这 个 类 ， 这 是 为 了 加 快 装载 过 程 的 速度 ， 那 它 还 是 会 表现 为 延迟 加 载 。 例 如 ， 如 
果 Java 虚拟 机 在 预先 装载 中 发 现 它 不 能 找到 某 个 特定 的 被 引用 的 类 ， 它 并 不 在 当时 抛 出 
NoClassDefFoundError 错误 ， 而 是 直到 (或 者 除非 ) 这 个 被 引用 类 首次 被 运行 程序 使 用 时 才 
抛 出 。 这 样 ， 如 果 Java 虚拟 机 进行 预先 链接 ， 第 四 趟 扫描 可 以 紧 随 第 三 趟 扫描 发 生 。 但 是 
如 果 Java 虚拟 机 在 某 个 符号 引用 第 一 次 被 使 用 时 才 进 行 解析 ， 那 么 第 四 趟 扫描 将 在 第 三 趟 
扫描 以 后 很 久 、 当 字 节 码 被 执行 时 才 进 行 。 
class 文件 的 检验 器 的 第 四 趟 扫描 仅仅 是 动态 链接 过 程 的 一 部 分 。 当 一 个 class 文件 被 
装载 时 ， 它 包含 了 对 其 他 类 的 符号 引用 以 及 它们 的 字段 和 方法 。 一 个 符号 引用 是 一 个 字符 
串 ， 它 给 出 了 名 字 ， 并 且 可 能 还 包含 了 其 他 关于 这 个 被 引用 项 的 信息 一 一 这 些 信息 必须 足 
以 唯一 地 识别 一 个 类 字段 或 方法 。 这 样 ， 对 于 其 他 类 的 符号 引用 必须 给 出 这 个 类 的 全 名 ; 
对 于 其 他 类 的 字段 的 符号 引用 必须 给 出 类 名 、 字 段 名 以 及 字段 描述 符 ， 对 于 其 他 类 中 的 方 
法 的 引用 必须 给 出 类 名 、 方 法 名 以 及 方法 的 描述 符 。 
动态 链接 是 一 个 将 符号 引用 解析 为 直接 引用 的 过 程 。 当 Java 虚拟 机 执行 字 节 码 时 ， 如 
果 它 遇 到 一 个 操作 码 ， 这 个 操作 码 第 一 次 使 用 一 个 指向 另 一 个 类 的 符号 引用 ， 那 么 虚拟 机 
就 必须 解析 这 个 符号 引用 。 虚 拟 机 在 解析 时 需要 执行 下 面 的 三 个 基本 任务 : 
口 ”查找 被 引用 的 类 (如 果 必 要 的 话 就 装载 它 )。 
口 ”将 符号 引用 替换 为 直接 引用 ， 这 样 当 它 以 后 再 次 遇 到 相同 的 引用 时 ， 它 就 可 以 立 
即使 用 这 个 直接 引用 ， 而 不 必 花 时 间 再 次 解析 这 个 符号 引用 了 。 
口 “ 当 Java 虚拟 机 解析 一 个 符号 引用 时 ，class 文件 检验 器 的 第 四 趟 扫描 确保 了 这 个 
引用 是 合法 的 。 当 这 个 引用 是 个 非法 引用 时 一 一 例如 ， 这 个 类 不 能 被 装载 ， 或 这 
个 类 的 确 存在 ， 但 是 不 包含 被 引用 的 字段 或 方法 一 一 class 文件 检验 器 将 抛 出 一 个 
错误 。 
继续 以 类 Volcano 为 例 进行 讲解 。 如 果 类 Volcano 中 的 某 个 方法 调用 了 类 Lava 中 的 某 
个 方法 ， 此 Lava 类 中 的 方法 的 全 名 和 描述 符 将 包含 在 Volcano 的 class 文件 的 二 进 制 数据 
中 。 当 Volcano 类 的 方法 在 执行 过 程 中 第 一 次 调用 Lava 的 方法 时 ，Java 虚拟 机 必须 确认 在 
类 Lava 中 存在 这 个 方法 ， 并 且 这 个 方法 的 名 字 和 描述 符 与 类 Volcano 中 期 待 的 相 匹 配 。 如 
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果 这 个 符号 引用 是 正确 的 ， 那 么 虚拟 机 将 把 它 蔡 换 为 一 个 直接 引用 ， 例 如 一 个 指针 ， 从 那 
时 开始 将 使 用 这 个 指针 。 如 果 类 Volcano 中 的 符号 引用 不 能 匹配 Lava 类 中 的 任何 方法 时 ， 
第 四 趟 扫描 验证 失败 ，Java 虚拟 机 将 抛 出 一 个 NoSuchMethodError。 

正 因为 Java 程序 是 动态 链接 的 ， 所 以 class 文件 检验 器 在 第 四 趟 扫描 中 ， 必 须 检查 相 
互 引用 的 类 之 间 是 否 兼容 。 如 果 我 们 修改 了 一 个 类 ，Java 编译 器 常会 重 编译 这 些 类 ， 从 而 
在 编译 时 检测 是 否 有 任何 的 不 兼容 性 。 但 是 也 有 很 多 时 候 ， 编 译 器 不 对 受 影响 的 类 进行 重 
编译 ， 例 如 ， 如 果 正 在 开发 一 个 大 型 系统 ， 很 可 能 将 系统 分 割 成 几 个 部 分 放 入 包 中 。 如 果 
对 每 个 包 进 行 独立 的 编译 ， 当 改动 包 中 的 一 个 类 时 ， 可 能 将 导致 同一 个 包 内 受 影响 的 那些 
类 需要 重新 编译 ， 但 是 对 于 其 他 包 来 说 就 不 需要 进行 重 编译 了 。 此 外 ， 如 果 使 用 了 其 他 人 
的 一 些 包 ， 尤 其 是 程序 在 运行 时 通过 网 络 下 载 了 一 些 类 ， 就 不 可 能 在 编译 时 检验 兼容 性 。 
这 就 是 为 什么 class 文件 检验 器 在 第 四 趟 扫描 时 ， 必 须 在 运行 时 检查 兼容 性 的 原因 。 

接 下 来 举 一 个 修改 不 兼容 的 例子 。 假 设 用 一 个 Java 编译 器 编译 了 类 Volcano， 因 为 类 
Volcano 中 的 一 个 方法 调用 了 另 一 个 类 Lava 中 的 方法 ，Java 编译 器 将 查找 类 Lava 的 class 
文件 或 源 文件 ， 以 确认 类 Lava 中 是 否 有 一 个 方法 具有 这 个 名 字 ， 返 回 类 型 和 相同 数量 并 
且 类 型 相同 的 参数 。 如 果 编 译 器 不 能 找到 任何 名 为 Lava 的 类 ， 或 者 找到 一 个 Lava 类 ， 但 
是 这 个 类 中 不 包含 想 要 找 的 方法 ， 那 么 编译 器 将 产生 一 个 错误 ， 并 且 将 不 为 Volcano 类 生 
成 class 文件 。 否 则 ，Java 编译 器 可 以 为 Lava 类 生成 与 Volcano 类 不 兼容 的 class 文件 。 如 
果 Lava 类 不 引用 Volcano 类 ， 当 改变 Lava 类 中 被 Volcano 引用 的 方法 的 方法 名 时 ， 这 样 
只 会 对 Lava 类 进行 重 编译 ， 如 果 在 运行 你 的 程序 时 ， 你 试图 使 用 新 版 本 的 Lava， 而 继续 
使 用 老 版 本 的 Volcano 类 ， 而 这 个 Volcano 类 将 和 新 版 本 的 Lava 不 兼容 ， 那 么 当 Volcano 
试图 调用 Lava 中 不 再 存在 的 方法 时 ， 在 第 四 趟 class 文件 检验 中 将 抛 出 一 
NoSuchMethodError。 

在 这 种 情况 下 ， 对 于 类 Lava 的 修改 将 打破 它 与 已 有 的 Volcano 的 class 文件 的 二 进 制 
兼容 性 。 实 际 上 ， 当 更 新 一 个 已 经 在 使 用 的 类 库 ， 并 且 它 的 新 版 本 与 已 有 的 代码 不 兼容 
时 ， 这 种 情况 就 会 发 生 。 为 了 能 方便 地 修改 类 库 的 代码 ，Java 编程 语言 被 设计 成 允许 对 一 
个 类 做 多 种 修改 ， 但 并 不 要 求 对 依赖 于 它 的 那些 类 进行 重 编译 。Java 语言 规范 中 列 出 了 用 
户 可 以 做 的 多 种 改动 ， 这 些 改 动 成 为 二 进 制 兼容 性 规则 。 这 些 规则 明确 地 定义 了 : 在 一 个 
类 中 ， 哪 些 可 以 被 修改 、 增 加 和 删除 ， 而 并 不 破坏 这 个 被 修改 的 类 与 依赖 于 它 的 那些 事先 
已 存在 的 类 之 间 的 二 进 制 兼容 性 。 例 如 ， 像 一 个 类 中 增加 一 个 新 的 方法 始终 是 一 个 影响 二 
进 制 兼容 性 的 改动 ， 但 是 不 能 删除 一 个 正在 被 其 他 类 使 用 的 方法 。 所 以 在 这 种 情况 下 ， 当 
改变 了 Lava 类 中 被 Volcano 调用 的 方法 的 名 称 时 ， 就 破坏 了 二 进 制 兼容 规则 ， 因 为 实际 上 
是 删除 了 一 个 老 的 方法 ， 并 加 入 了 一 个 新 的 方法 。 但 是 如 果 你 加 入 了 一 个 新 的 方法 ， 并 改 
写 了 老 的 方法 ， 让 它 调 用 新 的 方法 ， 那 么 这 个 改动 和 所 有 早已 使 用 的 Lava 的 、 事 先 已 有 
的 class 文件 是 二 进 制 兼容 的 ， 包 括 Volcano。 


3.2.4 内 置 于 Java 虚拟 机 (及 语言 ) 的 安全 特性 


在 Java 的 虚拟 机 中 会 装载 一 个 类 ， 当 对 此 类 进行 了 从 第 一 到 第 三 趟 的 class 文件 检验 
处 理 之 后 ， 就 可 以 运行 这 些 字 节 码 了 。 除 了 对 符号 引用 的 检验 (class 文件 检验 的 第 四 趟 扫 
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描 )，Java 虚拟 机 在 执行 字 节 码 时 还 需要 进行 其 他 一 些 内 置 的 安全 机 制 的 操作 。 这 些 机 制 大 
多 数 是 Java 的 类 型 安全 的 基础 ， 它 们 作为 Java 编程 语言 保证 Java 程序 健壮 性 的 特性 ， 也 
是 Java 虚拟 机 的 特性 。 下 面 就 是 内 置 于 Java 虚拟 机 (及 语言 ) 的 安全 特性 。 

口 ” 类 型 安全 的 引用 转换 。 

口 “ 结 构 化 的 内 存 访问 (无 指针 算法 )。 

口 ”自动 垃圾 收集 (不 必 显 示 地 释放 被 分 配 的 内 存 )。 

口 ” 数 组 边界 检查 。 

口 ” 空 引用 检查 。 

保证 一 个 Java 程序 只 能 使 用 类 型 安全 的 、 结 构 化 的 方法 去 访问 内 存 ，Java 虚拟 机 使 得 
Java 程序 更 为 健壮 ， 也 使 得 它们 的 运行 更 为 安全 。 如 果 一 个 程序 破坏 内 存 、 裔 演 ， 或 者 可 
能 导致 其 他 程序 裔 溃 ， 那 么 ， 他 就 是 一 个 安全 裂口 。 例 如， 如 果 正 在 运行 一 个 任务 关键 的 
服务 器 进程 ， 那 么 保证 这 个 进程 不 能 崩溃 就 非常 重要 。 这 种 层次 的 健壮 性 在 嵌入 式 系统 中 
也 非常 重要 ， 例 如， 蜂窝 电话 ， 因 为 人 们 通常 不 希望 重启 机 器 。 如 果 对 内 存 的 访问 不 加 限 
制 条 件 ， 会 导致 安全 隐患 的 另 一 个 原因 是 ， 一 个 老 谋 深 算 的 黑客 可 能 暗中 利用 它 破 坏 安全 
系统 。 例 如 一 个 黑客 知道 一 个 类 装载 器 在 内 存 中 的 位 置 ， 他 可 以 赋 一 个 指针 指向 那 块 内 
存 ， 从 而 对 类 装载 器 的 数据 进行 操作 。 通 过 强制 对 内 存 的 结构 化 访问 ，Java 虚拟 机 可 以 产 
生 健 壮 的 程序 ， 而 且 还 可 以 阻挠 那些 黑客 ， 使 他 们 不 能 为 了 达到 某 些 目的 而 破坏 Java 虚拟 
机 的 内 在 存储 。 

内 置 在 Java 虚拟 机 中 的 另 一 个 安全 特性 是 作为 内 存 的 结构 化 访问 的 一 个 后 备 ， 也 就 是 
并 未 指明 运行 时 数据 空间 在 Java 虚拟 机 内 部 是 怎样 分 布 的 。 运 行 时 数据 空间 是 指 一 些 内 存 
空间 ，Java 虚拟 机 用 这 些 空间 来 存储 运行 一 个 Java 程序 时 所 需要 的 数据 ，Java 栈 (每 个 线 
程 一 个 )、 一 个 存储 字 节 码 的 方法 区 ， 以 及 一 个 垃圾 收集 堆 ( 它 用 来 存储 由 运行 的 程序 创建 
的 对 象 )。 如 果 查 看 一 个 class 文件 的 内 部 ， 将 找 不 到 任何 内 存 地 址 。 当 Java 虚拟 机 装载 一 
个 class 文件 时 ， 由 它 决定 将 这 些 字 节 码 以 及 其 他 从 class 文件 中 解析 得 到 的 数据 放置 在 内 
存 的 什么 地 方 。 当 Java 虚拟 机 启动 一 个 线程 时 ， 由 它 决定 将 它 为 这 线程 创建 Java 栈 放 到 
哪里 ， 当 它 创 建 一 个 新 的 对 象 时 ， 也 是 由 它 决定 将 这 个 对 象 放 到 内 存 中 的 什么 地 方 。 这 样 
一 个 黑客 就 不 可 能 仅 赁 class 文件 中 的 内 容 ， 就 知道 在 内 存 中 的 哪些 数据 代表 了 这 个 类 ， 
或 从 那些 这 个 类 实例 化 而 得 到 的 对 象 (对 于 黑客 来 说 )。 更 糟糕 的 是 ， 黑 客 不 能 通过 阅读 
Java 虚拟 机 的 规范 来 得 到 关于 内 存 布 局 的 任何 信息 。 在 规范 中 ， 并 未 说 明 Java 虚拟 机 是 怎 
样 布局 它 的 内 存 数 据 的 。 对 于 每 个 Java 虚拟 机 的 实现 来 说 ， 由 它 的 设计 者 来 决定 使 用 什么 
数据 结构 来 表示 运行 时 数据 空间 ， 并 且 将 它们 存放 在 内 存 的 哪个 位 置 。 因 此 ， 即 使 黑客 可 
以 在 一 定 程度 上 突破 Java 虚拟 机 的 内 存 访问 限制 ， 他 们 也 会 在 四 处 查找 某 些 东 西 想 进行 暗 
中 破坏 时 遇 到 困难 。 

通常 来 说 ， 虚 拟 机 会 禁止 对 内 存 进行 非 结 构 化 访问 。 其 实 Java 虚拟 机 并 不 是 必须 主动 
强制 正在 运行 的 程序 ， 因 为 这 种 禁止 其 实 是 字 节 码 指令 集 本 身 的 内 在 本 质 。 就 像 在 Java 编 
程 语言 中 ， 无 法 表达 一 个 非 结构 化 的 内 存 访问 那样 ， 并 且 在 字 节 码 中 也 没有 办 法 表达 非 结 
构 化 的 内 存 访问 ， 即 使 是 我 们 自己 编写 的 字 节 码 。 所 以 在 禁止 对 内 存 的 非 结构 化 访问 时 ， 
是 对 防止 对 内 存 恶 意 破坏 的 一 种 阻碍 。 
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其 实 可 以 有 法 突破 由 支持 Java 虚拟 机 的 类 型 安全 机 制 所 建立 的 安全 屏障 。 虽 然 字 节 码 
指令 集 没 有 向 用 户 提供 不 安全 的 ， 非 结构 化 的 内 存 访问 方法 ， 但 是 完全 可 以 绕 过 字 节 码 ， 
即 调用 本 地 方法 。 当 调用 本 地 方法 时 ，Java 安全 沙 箱 会 完全 不 起 作用 。 首 先 ， 健 壮 性 的 保 
证 对 于 本 地 方法 并 不 适用 ， 虽 然 不 能 通过 Java 方法 破坏 内 存 ， 但 是 可 以 通过 本 地 方法 来 实 
现 这 个 目的 。 并 且 最 重要 的 是 ， 本 地 方法 没有 经 过 Java API， 所 以 当 一 个 本 地 方法 试图 进 
行 破坏 性 动作 时 ， 安 全 管理 器 并 没有 被 检查 。 这 样 ， 一 旦 某 个 线程 进入 一 个 本 地 方法 ， 无 
论 Java 虚拟 机 内 置 了 何 种 安全 策略 ， 只 要 这 个 线程 运行 这 个 本 地 方法 ， 此 时 的 安全 策略 将 
不 再 对 这 个 线程 适用 。 因 为 在 调用 本 地 方法 时 动态 链接 库 是 必需 的 ， 所 以 专门 在 安全 管理 
器 中 包含 了 一 个 对 应 的 处 理 方法 ， 通 过 此 方法 可 以 确定 一 个 程序 是 否 能 动态 装载 连接 库 。 
例如 ， 因 为 不 可 靠 的 applet 不 能 装载 新 的 动态 链接 库 ， 所 以 它们 不 能 安装 自己 的 新 的 本 地 
方法 ， 但 是 他 们 可 以 调用 Java API 中 的 方法 ， 这 些 方法 可 能 是 本 地 的 ， 但 是 这 些 方法 是 可 
信 的 。 当 线程 调用 本 地 方法 时 ， 这 个 线程 就 跳出 了 沙 箱 。 所 以 对 于 本 地 方法 来 说 ， 这 个 安 
全 模型 就 和 保障 计算 机 安全 的 传统 的 安全 模型 完全 相同 ， 也 就 是 说 在 调用 本 地 方法 前 必须 
确认 它 是 可 信任 的 。 

为 了 保证 安全 而 内 置 于 Java 虚拟 机 的 最 后 一 个 机 制 ， 就 是 异常 的 结构 化 错误 处 理 。 因 
为 Java 虚拟 机 支持 异常 ， 所 以 当 一 些 潍坊 安全 的 行为 发 生 时 会 进行 结构 化 处 理 ，Java 虚拟 
机 将 抛 出 一 个 异常 或 者 错误 ， 而 不 会 发 生 衣 江 现象 。 这 个 异常 或 者 错误 会 使 这 个 错误 线程 
的 死亡 ， 而 不 会 使 整个 系统 衣 溃 。 抛 出 一 个 错误 (和 抛 出 一 个 异常 对 应 ) 总 是 导致 抛 出 错误 
的 这 个 线程 死亡 。 这 对 一 个 运行 的 Java 程序 来 说 通常 是 一 个 不 便 因 素 ， 但 它 不 会 导致 整个 
程序 的 中 止 。 如 果 这 个 程序 还 有 一 些 线程 正在 正常 工作 ， 则 这 些 线程 有 可 能 继续 正常 工 
作 ， 即 使 它 的 同伴 已 经 死亡 。 而 抛 出 一 个 异常 可 能 导致 这 个 线程 的 死亡 ， 但 是 它 经 常 作为 
一 种 手段 被 使 用 ， 使 程序 能 够 将 控制 从 发 生 异 常 的 地 方 转 到 处 理 异 常 的 情况 。 


3.2.5 ”安全 管理 器 和 Java API 


这 是 安全 沙 箱 中 ， 离 我 们 程序 员 最 接近 的 一 环 。SecurityMananger 安全 管理 器 是 一 个 
API 级 别 的 、 可 以 自 定义 的 安全 策略 管理 器 ， 它 深入 到 Java API 中 ， 在 各 处 都 可 以 见 到 它 
的 身影 。 比 如 SecurityClassLoader。 

在 默认 情况 下 ，Java 应 用 程序 是 不 设置 SecurityManager 实例 的 ， 这 意味 着 不 会 起 到 
安全 检查 ， 这 个 实例 需要 我 们 在 程序 启动 时 通过 System.setSecurityManager 来 设置 。 

在 一 般 情况 下 ， 通 过 SecurityManager.checkPermission(Permission perm) 来 完成 权限 检 
查 。 外 部 程序 通过 创建 Permission 实例 传递 给 前 面 的 检查 。 

Permission 是 一 个 抽象 类 ， 需 要 继承 它 实现 不 同 的 权限 验证 ， 比 如 下 面 的 
FilePermission 代表 对 某 个 文件 的 读 写 权 限 。 


new FilePermission("test.txt", "read") 


综 上 所 述 ，Java 的 沙 箱 安全 模型 最 重要 的 优点 之 一 是 ， 这 些 组 件 中 的 类 装载 器 和 安全 
管理 器 是 可 以 由 用 户 定制 的 。 通 过 定制 这 些 组 件 ， 可 以 为 Java 程序 创建 个 性 化 的 安全 策 
略 。 但 是 这 种 可 定制 性 是 需要 代价 的 ， 因 为 这 种 体系 结构 的 灵活 性 也 对 它 本 身 产生 一 定 的 
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风险 。 类 装载 器 和 安全 管理 器 非常 复杂 ， 因 此 ， 单 纯 的 定制 操作 也 可 能 潜在 地 产生 错误 ， 
从 而 开启 安全 漏洞 。 

在 Java API 的 每 一 个 主要 版 本 中 都 进行 了 一 些 改进 ， 使 得 创建 定制 的 安全 策略 时 出 错 
机 会 更 少 。 最 重要 的 改变 是 是 从 1.2 版 本 开始 的 ， 从 此 引入 了 一 个 新 的 且 更 为 精细 的 访问 
控制 体系 结构 。 在 以 前 的 1.0 版 本 和 1.1 版 本 中 ， 访 问 控制 包括 安全 策略 规范 和 运行 时 安 
全 策略 的 实施 ， 它 是 由 称 作 安 全 管理 器 的 对 象 负责 的 。 要 在 1.0 版 本 和 1.1 版 本 中 建立 定 
制 的 策略 ， 必 须 编写 自己 的 定制 安全 管理 器 。 在 1.2 版 本 中 ， 可 以 利用 Java 2 平台 提供 的 
安全 管理 器 ， 这 个 预先 制作 好 的 安全 管理 器 ， 人 允许 用 户 在 一 个 和 程序 分 离 的 ASCII 策略 文 
件 中 说 明 安 全 策略 。 在 运行 时 ， 这 个 预先 定制 好 的 安全 管理 器 获得 一 个 类 的 帮助 ， 来 执行 
在 策略 文件 中 说 明 的 安全 策略 。 在 版 本 1.2 中 引入 的 访问 控制 基础 架构 提供 了 灵活 易 定制 
的 安全 管理 器 的 默认 实现 ， 这 个 默认 实现 可 以 满足 大 多 数 的 安全 需求 。 为 了 向 后 兼容 ， 也 
为 了 使 一 些 有 特殊 安全 需要 的 团体 可 以 对 预先 制作 好 的 安全 管理 器 中 的 默认 功能 进行 改 
写 ， 版 本 1.2 的 应 用 程序 还 可 以 安装 它们 自己 的 安全 管理 器 。 是 使 用 预先 制作 的 安全 管理 
器 ， 还 是 使 用 在 它 之 上 进行 扩展 的 访问 控制 基础 架构 ， 用 户 使 可 以 选择 的 。 

前 面 介绍 的 三 个 Java 安全 模型 共同 实现 了 一 个 目的 : 保持 Java 虚拟 机 的 实例 和 它 正 
在 运行 的 应 用 程序 的 内 部 完整 性 ， 使 得 它们 不 被 下 载 的 恶意 或 有 漏洞 的 代码 侵犯 。 这 个 安 
全 模型 的 第 四 个 组 成 部 分 是 安全 管理 器 ， 它 主要 用 于 保护 虚拟 机 的 外 部 资源 不 被 虚拟 机 内 
运行 的 恶意 或 有 漏洞 的 代码 侵犯 。 这 个 安全 管理 器 是 一 个 单独 的 对 象 ， 在 运行 的 Java 虚拟 
机 中 ， 它 在 外 部 资源 的 访问 控制 中 起 到 了 中 枢 作 用 。 

安全 管理 器 定义 了 沙 箱 的 外 部 边界 。 因 为 它 是 可 定制 的 ， 所 以 它 允 许 为 程 序 建立 自 定 
义 的 安全 策略 。 当 Java API 进行 任何 可 能 不 安全 的 操作 时 ， 它 都 会 向 安全 管理 器 请 求 许 
可 ， 从 而 强制 执行 自 定义 的 安全 策略 。 要 向 安全 管理 器 请 求 许可 ，JavaAPI 将 调用 安全 管 
理 器 的 “check” 方 法 。 因 为 这 些 方法 的 名 都 以 “check” 开 头 ， 所 以 他 们 被 称 为 “check” 
方法 。 例 如 ， 安 全 管理 器 的 方法 checkRead0 决 定 了 线程 是 否 可 以 读 取 一 个 特定 的 文件 ， 方 
法 checkWrite(0) 决 定 了 线程 是 否 对 一 个 特定 的 文件 进行 写 操作 。 这 些 方法 的 实现 定义 了 应 
用 程序 的 定制 安全 策略 。 

因为 Java API 在 进行 一 个 可 能 不 安全 的 操作 前 ， 总 是 检查 安全 管理 器 ， 所 以 Java API 
不 会 在 安全 管理 器 建立 的 安全 策略 之 下 执行 被 禁止 的 操作 。 如 果 安 全 管理 器 禁止 这 个 操 
作 ，Java API 就 不 会 执行 这 个 操作 。 

当 启 动 Java 应 用 程序 时 还 没有 安全 管理 器 ， 但 是 应 用 程序 通过 将 一 个 指向 
java.lang.SecurityManager 或 是 其 子 类 的 实例 传 给 setSecurityManager()， 以 此 来 安装 安全 管 
理 器 ， 这 个 动作 是 可 选 的 。 如 果 应 用 程序 没有 安装 安全 管理 器 ， 那 么 它 将 不 会 对 请 求 Java 
API 的 任何 动作 做 限制 。Java API 将 做 任何 被 请 求 的 事 。 如 果 应 用 程序 确实 安装 了 安全 管 
理 器 ， 那 么 安全 管理 器 将 负责 应 用 程序 整个 剩余 的 生命 周期 ， 它 不 能 被 蔡 代 、 扩 展 或 修 
改 。 从 这 一 点 开始 ，Java API 将 只 执行 那些 被 安全 管理 器 同意 的 请 求 。 然 而 在 1.2 版 本 
中 ， 当 前 安装 的 安全 管理 器 可 以 被 允许 蔡 换 它 的 代码 所 替换 ， 这 是 通过 对 指向 另 一 个 不 同 
的 安全 管理 器 对 象 的 引用 调用 System.setSecurityManager0 实 现 的 。 

如 果 禁 止 了 一 个 手 检 查 的 动作 ， 则 安全 管理 器 的 “check” 方 法 将 抛 出 一 个 安全 异常 ， 
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如 果 这 个 动作 被 允许 则 简单 地 返回 。 所 以 当 一 个 Java API 即将 进行 一 个 潜在 不 安全 的 动作 
时 ， 它 将 遵循 以 下 两 个 步骤 。 

(1) Java API 的 代码 检查 有 没有 安装 安全 管理 器 ， 如 果 没 有 安装 ， 则 跳 过 第 二 步 直 接 
继续 这 个 潜在 不 安全 的 动作 。 

(2) 否则 在 第 二 步 中 将 调用 安全 管理 器 中 的 合适 的 “check” 方 法 。 如 果 这 个 操作 被 禁 
止 ， 那 么 此 “check” 方 法 会 抛 出 一 个 安全 异常 ， 这 将 导致 该 Java API 方法 立即 中 止 ， 这 
个 潜在 不 安全 的 操作 将 不 会 被 执行 。 相 反 ， 如 果 这 个 操作 被 多 许 ， 那 么 这 个 “check” 方 法 
将 简单 地 返回 。 此 时 这 个 Java API 方法 将 继续 运行 ， 并 执行 这 个 潜在 不 安全 的 操作 。 


3.3 ” 浅 谈 安全 管理 器 的 必要 性 


在 整个 Java 虚拟 机 系统 中 ， 安 全 管理 器 主要 负责 如 下 两 个 工作 : 

口 ”说 明 一 个 安全 策略 。 

口 ”执行 这 个 安全 策略 。 

安全 策略 指明 了 哪 种 代码 将 被 允许 执行 哪 种 操作 ， 它 是 由 安全 管理 器 中 的 方法 
“check” 的 代码 定义 的 。 当 它们 被 调用 时 ， 这 个 策略 将 被 方法 “check” 所 实施 。 在 本 节 
的 内 容 中 ， 将 详细 讲解 安全 管理 器 在 虚拟 机 中 的 必要 性 。 


3.3.1 ”公正 评论 安全 管理 器 优点 和 弱点 


客观 公正 地 说 ， 虽 然 安全 管理 器 的 可 配置 性 是 Java 安全 模型 的 最 大 优点 之 一 ， 但 是 也 
存在 一 个 潜在 的 弱点 。 例 如 编写 一 个 安全 管理 器 是 一 项 复杂 的 任务 ， 并 且 很 可 能 会 导致 错 
误 发 生 。 在 实现 安全 管理 器 的 check 方法 时 ， 任 何 错误 都 将 变 成 运行 时 的 安全 漏洞 。 为 了 
帮助 开发 人 员 和 终端 用 户 方便 地 ， 尽 量 正确 地 建立 一 个 基于 签名 代码 的 细 粒 度 的 安全 策 
略 ， 例 如 类 java.lang.SecurityManger 是 一 个 具体 的 类 ， 此 类 提供 了 一 个 默认 的 安全 管理 器 
的 实现 。 用 户 的 应 用 程序 可 以 显 式 地 实例 化 并 安装 这 个 安全 管理 器 ， 或 者 也 可 以 让 它 自动 
安装 。 例 如 ， 在 JDK 1.7 中 ， 可 以 在 命令 行使 用 Djava.security.manager 选项 来 指明 安装 具 
体 安 全 管理 器 。 

具体 安全 管理 器 类 允许 用 户 不 用 Java 代码 定义 自己 的 定制 策略 ， 而 是 使 用 一 个 称 为 策 
略 文件 的 ASCII 文件 。 在 策略 文件 中 ， 可 以 给 代码 来 源 授予 权限 。 权 限 是 用 类 定义 的 ， 它 
是 java.security.Permission 的 子 类 。 例 如 ，java.io.FilePermission 表示 了 对 一 个 文件 的 读 写 
执行 或 者 删除 权限 。 代 码 来 源 是 由 代码 库 的 URL 和 一 些 签名 组 成 的 ， 从 这 个 URL 可 以 装 
载 代码 ， 而 签名 则 为 这 个 代码 作 担保 。 当 创建 安全 管理 器 时 ， 它 对 策略 文件 进行 解析 ， 并 
创建 CodeSource 和 Permission 对 象 ， 这 些 对 象 被 封装 在 一 个 单独 的 Policy 对 象 中 ， 此 
了 Policy 对 象 代 表 了 运行 时 的 策略 。 任 何 时 刻 只 能 有 一 个 Policy 对 象 被 封装 。 

类 装载 器 将 类 型 放 到 保护 域 中 ， 保 护 域 封装 了 授予 代码 来 源 的 所 有 权限 ， 这 些 代 码 来 
源 由 装载 的 类 型 代表 。 每 一 个 被 装载 虚拟 机 中 的 类 型 都 属于 一 个 且 只 属于 一 个 保护 域 。 这 
个 保护 域 会 被 记 下 来 ， 并 且 在 决定 这 个 代码 是 否 被 允许 执行 一 些 可 能 不 安全 的 操作 时 使 
用 它 。 
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3.3.2 方法 check 


当 调 用 具体 安全 管理 器 的 方法 check 时 ， 他 们 中 的 大 多 数 都 将 请 求 传递 给 一 个 称 为 
AccessController 的 类 。 此 AccessController 类 使 用 了 包含 在 保护 域 对 象 中 的 信息 ， 这 个 对 
象 所 属 的 类 的 方法 在 调用 栈 中 ，AccessController 进行 栈 检查 以 确定 这 个 操作 能 否 被 执行 。 

在 古老 的 版 本 1.0 和 1.1 中 ， 每 一 个 check 方法 都 在 它们 的 方法 名 中 指出 了 将 检查 什 
么 。 为 了 检查 能 否 读 取 一 个 特定 的 文件 ，JavaAPI 调用 了 安全 管理 器 的 checkRead() 方 法 ， 
并 且 将 被 读 取 文 件 的 路 径 名 作为 参数 传 入 。 例 如 在 试图 读 取 文件 /tmp/finances.dat 之 前 ， 安 
全 管理 器 调用 了 checkRead(“/tmp/finances.dat”)。 
安全 管理 器 声明 了 28 个 check 方法 ， 下 面 详细 列 出 了 其 中 最 为 常用 的 27 个 check 方 
同时 也 列 出 了 它们 被 Java API 代码 触发 调用 时 的 潜在 不 安全 动作 : 

口 ”checkConnect(String host,int port): 功能 是 打开 一 个 指定 主机 和 端口 号 的 socket 连 

接 前 辈 调 用 。 

口 ”checkConnect(String host, int port, Object context): 功能 是 在 被 传递 的 安全 上 下 文 

中 打开 一 个 指定 主机 和 端口 号 的 socket 连接 前 调用 。 

口 “checkAccept(String host int port): 功能 是 接收 一 个 来 自 于 指定 主机 和 端口 号 的 
socket 连接 前 被 调用 。 

口 ”checkCreateClassloader(): 功能 是 创建 一 个 新 的 类 加 载 器 前 被 调用 。 

口 ”checkAccess(Thead t): 功能 是 改变 一 个 线程 (如 改变 它 的 优先 级 、 中 止 它 等 ) 前 被 
调用 。 

口 “checkAccess(ThreadGroup t): 功能 是 改变 一 个 线程 组 (如 加 入 一 个 新 的 线程 、 设 置 
守护 进程 等 ) 前 被 调用 。 

口 ”checkExists0: 功能 是 应 用 程序 退出 前 被 调用 。 

口 ”checkLink(): 功能 是 装载 一 个 包含 本 地 方 的 动态 库 前 调用 。 

口 ”checkRead(FileDescription fd): 功能 是 读 取 指 定 的 文件 前 被 调用 。 

口 

口 


法 


checkRead(String file): 功能 是 读 取 指 定 的 文件 前 被 调用 。 
checkRead(String file，Objectcontext): 功能 是 在 被 传递 的 安全 上 下 文中 读 取 指定 
的 文件 前 被 调用 。 

口 ”checkWrite(FileDescription fd): 功能 是 对 指定 的 文件 进行 写 操作 前 被 调用 。 

口 ”checkWrite(Stimg file): 功能 同上 。 

口 ”checkListen(intport): 功能 是 在 指定 的 本 地 端口 号 上 等 待 连接 前 被 调用 。 

口 ”checkMnulticase(IndeAddress maddr): 功能 是 在 加 入 、 离 开 、 发 送 或 者 接收 全 组 播 
前 被 调用 。 

口 。 checkMulticase(InedAddress maddr，byte t): 功能 是 在 加 入 、 离 开 、 发 送 或 者 接收 
JP 组 播 前 被 调用 。 此 函数 需要 传递 数据 的 大 小 作为 参数 。 

口 ”checkPropertiesAccess(): 功能 是 访问 和 修改 一 般 的 系统 属性 前 被 调用 。 

口 ”checkPropertiesAccess(String key): 功能 是 访问 或 修改 指定 的 系统 属性 前 被 调用 。 

口 ”checkTopLevelWindow(Object window): 功能 是 不 出 示 任 何 警告 地 显示 指定 的 窗 
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口 前 被 调用 。 

chceckPrintabAccess(): 功能 是 初始 化 一 个 打印 任务 请 求 前 被 调用 。 
checkSystemClipboardAccess(): 功能 是 访问 系统 剪贴 板 前 被 调用 。 
checkPackageAccess(String pkg): 功能 是 访问 指定 的 包 ( 被 类 装载 器 使 用 ) 中 的 类 型 
前 被 调用 。 

checkPackageDefinition(Stirmng pkg): 功能 是 在 指定 的 包 ( 被 类 装载 器 使 用 ) 中 加 入 一 
个 新 类 前 被 调用 。 

checkSetFactory(): 功能 是 设置 被 ServerSocket 或 者 Socket 使 用 的 socket 类 或 者 
设置 被 URL 使 用 的 URL 流 处 理 器 前 被 调用 。 

checkMembetAccess(): 功能 是 通过 映像 API 访问 类 信息 前 被 调用 。 

在 后 来 的 新 版 本 中 定义 了 一 些许 可 类 ， 这 些 类 的 实例 代表 了 这 样 的 代码 ， 即 它 的 操作 
是 被 允许 的 。 例 如 在 1.2 版 本 的 类 java.lang.SecurityManager 中 添加 了 一 对 新 的 check 方 
法 ， 方 法 名 都 是 checkPermission(): 

口 ”checkPermission(Permission perm): 功能 是 进行 某 个 操作 ( 它 需 要 指定 的 权限 ) 前 被 

调用 。 

口 ”checkPermission(Permission perm，Objectcontext): 功能 是 在 被 传递 的 安全 上 下 文 

中 进行 某 个 操作 ( 它 需 要 指定 的 权限 ) 前 被 调用 。 

上 述 checkPermission() 方 法 能 够 接受 一 个 Permission 对 象 的 引用 ， 它 指出 了 被 请 求 的 
操作 。 这 样 此 方法 就 提供 了 另 一 种 方式 ， 询 问安 全 管理 器 是 否 可 以 执行 一 个 潜在 不 安全 的 
动作 。 例 如 要 确定 是 否 可 以 读 文 件 /tmp/finances.dat， 新 版 本 中 的 Java API 可 以 在 两 种 方法 
中 任 选 一 种 。Java API 可 以 采用 老式 的 步 又， 调用 老式 的 方法 checkRead0， 并 将 字符 串 
/tmp/finance.dat 作为 参数 传递 给 它 。 或 者 Java API 也 可 以 采用 新 的 方法 ， 创 建 一 
java.io FilePermission 对 象 ， 将 字符 串 “/tmp/finance.dat” 和 “read” 传 给 构造 器 
FilePermission ， 然 后 Java API 将 这 个 Permission 对 象 传 给 安全 管理 器 的 方法 
checkPermission()。 

无 论 是 使 用 老式 方式 调用 一 个 老式 的 check 方法 ， 还 是 使 用 新 版 本 方法 创建 一 个 
Permission 对 象 并 调用 checkPermission() 都 会 产生 相同 的 结果 。 为 了 保持 安全 管理 器 对 版 本 
1.0 和 1.1 的 向 后 兼容 性 ， 新 版 本 中 的 Java API 继续 使 用 了 老 的 方法 。Java API 继续 调用 了 
28 个 老式 的 check 方法 。 但是， 在 具体 安全 管理 器 类 中 ， 老 的 方法 大 部 分 都 用 新 的 
checkPermission() 方 法 实现 了 。 因 此 通过 调用 具体 安全 管理 器 的 老式 方法 ，JavaAPI 实际 上 
间接 地 调用 了 checkPermission() 方 法 。 

Java API 可 能 多 次 直接 调用 checkPermission()。 对 于 版 本 1.2 及 其 以 后 的 版 本 中 引入 的 
新 的 潜在 不 安全 操作 的 概念 ， 不 存在 老式 的 check 方法 。 所 以 在 这 种 情况 下 ，Java API 将 
创建 一 个 新 的 Permission 对 象 ， 这 个 对 象 不 存在 与 之 相关 的 check 方法 。 然 后 Java API 将 
把 这 个 Permission 对 象 直接 传 给 安全 管理 器 的 checkPermission() 方 法 。 

在 具体 的 安全 管理 器 类 中 ， 方 法 checkPermission0 同 样 负责 决定 ， 是 否 允 许 将 某 个 操 
作 的 任务 委派 给 另 一 个 方法 。 此 方法 checkPermission0 只 是 简单 地 调用 了 类 
java.security.AccessController 中 的 静态 方法 checkPermission()， 并 将 这 个 Permission 对 象 传 


口 
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口 
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递 给 它 ， 因 此 在 使 用 具体 安全 管理 器 时 ， 类 AccessController 才 是 真正 负责 执行 安全 策略 
的 实体 。 

Java 中 的 所 有 上 述 改变 都 是 支持 向 后 兼容 的 ， 假 如 为 版 本 1.1 创建 了 一 个 安全 管理 
器 ， 它 也 可 以 在 1.2 版 本 中 正常 运行 ， 也 可 以 在 版 本 1.2 中 创建 一 个 自 定义 的 安全 管理 
器 ， 这 样 可 以 创建 一 个 不 同 的 安全 基础 架构 ， 从 而 满足 具体 安全 管理 器 实现 所 不 能 解决 的 
特殊 的 安全 需要 。 然 而 利用 内 置 在 具体 安全 管理 器 中 的 灵活 性 和 可 扩展 性 ， 大 多 数 人 的 安 
全 需要 都 应 该 能 被 满足 。 


3.4 代码 签名 和 认证 


Java 安全 模型 的 重要 功能 是 支持 认证 ， 这 是 从 java 1.1 的 java.security 包 及 其 子 包 中 就 
开始 引入 的 特性 。 认 证 功能 加 强 了 用 户 的 能 力 ， 使 用 户 能 通过 实现 一 个 沙 箱 来 建立 多 种 安 
全 策略 ， 这 个 沙 箱 可 以 依赖 于 为 这 个 代码 提供 担保 的 对 象 来 改变 。 认 证 可 以 使 用 户 确认 ， 
由 某 些 团体 担保 的 一 些 class 文件 是 值得 信任 的 ， 并 且 这 些 class 文件 在 到 达 用 户 虚拟 机 的 
途中 没有 被 改变 。 这 样 ， 如 果 用 户 在 一 定 程度 上 信任 这 个 为 代码 作 担保 的 团体 ， 也 就 可 以 
在 一 定 程度 上 简化 沙 箱 对 这 段 代 码 实 施 的 限制 。 可 以 对 由 不 同 团体 签名 的 代码 建立 不 同 的 
安全 限制 。 在 本 节 的 内 容 中 ， 将 简要 介绍 代码 签名 和 认证 的 基本 知识 。 


3.4.1 代码 签名 和 密 钥 


要 对 一 段 代码 作 担保 或 者 签名 ， 必 须 首先 生成 一 个 “ 公 钥 / 私 铀 ”对 。 用 户 应 该 保管 那 
把 私 钥 ， 而 把 公 钥 公 开 。 至 少 ， 应 该 把 公 钥 给 那些 要 你 在 你 的 签名 上 建立 安全 策略 的 人 。 
一 旦 拥有 了 一 个 公 钥 / 私 钥 对 ， 就 必须 将 要 签名 的 class 文件 和 其 他 文件 放 到 一 个 JAR 文件 
中 ， 然 后 使 用 一 个 工具 (例如 版 本 1.2 SDK 中 的 Jarsigner) 对 整个 JAR 文件 进行 签名 。 这 个 
签名 工具 将 首先 对 JAR 文件 的 内 容 进行 单 向 散 列 计算 ， 以 产生 一 个 散 列 。 然 后 这 个 工具 将 
用 私 钥 对 这 个 散 列 进行 签名 ， 并 且 将 经 过 签名 后 的 散 列 加 到 JAR 文件 的 末尾 。 这 个 签名 后 
的 散 列 代表 了 你 对 这 个 JAR 文件 内 容 的 数字 签名 。 当 你 发 布 这 个 包含 签名 散 列 的 JAR 文 
件 时 ， 那 些 持 有 你 的 公 钥 的 人 将 对 JAR 文件 验证 两 件 事 : 这 个 JAR 文件 确实 是 你 签名 
的 ， 并 且 在 你 签名 后 这 个 JAR 文件 没有 做 过 任何 改动 。 

数字 签名 过 程 的 第 一 步 是 一 个 单 向 的 散 列 计算 ， 它 输入 大 量 的 数据 ， 但 产生 少量 的 数 
据 ， 称 为 散 列 。 在 这 个 JAR 文件 的 例子 中 ， 这 个 计算 的 大 量 输入 就 是 组 成 这 个 JAR 文件 
内 容 的 字 节 流 。 这 个 单 向 散 列 计算 之 所 以 被 称 为 “ 单 向 ”， 是 因为 在 只 给 出 散 列 的 情况 
下 ， 这 个 散 列 值 不 能 包含 足够 的 输入 信息 ， 因 此 不 能 从 散 列 重 新 生成 输入 。 这 个 计算 时 单 
向 的 ， 从 大 到 小 ， 从 输入 到 散 列 。 

散 列 也 被 称 为 消息 文摘 ， 它 相当 于 一 种 束缚 “指纹 ”。 虽 然 不 同 的 输入 可 能 产生 相同 
的 散 列 ， 但 通常 认为 ， 在 实际 的 情况 下 ， 一 个 散 列 足以 代表 了 它 的 输入 。 就 像 用 指纹 代表 
人 一 样 ， 一 个 散 列 也 被 用 于 识别 用 单 向 散 列 算法 产生 这 个 散 列 的 输入 。 在 认证 过 程 中 ， 散 
列 别 用 于 验证 某 个 输入 是 否 和 产生 这 个 原始 散 列 的 输入 相同 ， 换 名 话说， 这 个 输入 在 到 达 
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目的 地 的 途中 有 没有 被 改动 。 

因为 不 可 能 仅仅 用 散 列 重 构 原 输入 ， 一 个 散 列 尽 在 可 以 得 到 原 输入 时 才 有 用 。 因 此 必 
须 一 起 传输 输入 和 散 列 。 其 实 输入 和 散 列 的 组 合并 不 安全 ， 因 为 就 算是 一 个 初级 黑客 也 可 
以 方便 地 将 输入 和 散 列 一 起 蔡 换 掉 。 为 了 防止 这 种 情况 发 生 ， 必 须 在 发 送 散 列 前 使 用 私 角 
对 其 进行 加 密 ， 只 加 密 散 列 而 不 是 对 整个 JAR 进行 加 密 ， 这 是 因为 用 私 钥 进行 加 密 是 一 个 
相当 费时 的 过 程 。 一 般 来 说 ， 从 JAR 文件 中 计算 、 产 生 一 个 单项 散 列 ， 并 对 这 个 散 列 用 私 
钥 进 行 加 密 ， 要 比 对 整个 Jar 文件 进行 私 钥 加 密 来 得 快 。 只 有 当 一 个 黑客 拥有 我 们 的 私 钥 
时 ， 他 才能 同时 蔡 换 输入 和 加 密 后 的 散 列 。 由 此 可 见 ， 只 要 小 心 保护 我 们 的 私 钥 ， 破 解 输 
入 和 加 密 散 列 组 合 就 更 困难 了 ， 因 为 黑客 不 可 能 拥有 我 们 的 私 钥 。 

任何 用 我 们 的 私 钥 加 密 的 东西 都 可 以 用 我 们 的 公 钥 解密 。 公 钥 / 私 钥 对 具有 这 种 特点 ， 
在 仅 给 出 公 钥 的 情况 下 ， 要 产生 私 钥 是 非常 困难 的 。 如 果 黑 客 不 能 得 到 我 们 的 私 钥 ， 对 他 
来 说 最 好 的 选择 就 是 试图 将 原 输入 蔡 换 为 男 一 个 输入 ， 这 个 输入 必须 和 原 输入 产生 相同 的 
散 列 值 。 例 如 ， 一 个 黑客 想 要 在 你 的 Jar 文件 中 将 一 个 class 文件 蔡 换 成 男 一 个 执行 恶意 动 
作 的 class 文件 ， 被 修改 的 Jar 文件 产生 一 个 不 同 的 散 列 的 几率 是 非常 高 的 。 但 是 这 个 黑客 
可 以 往 jar 文件 中 添加 随机 的 数据 ， 知 道 产生 和 原来 一 样 的 散 列 值 。 如 果 黑 客 可 以 产生 这 
样 一 个 可 供 选 择 的 输入 一 一 既 可 以 帮助 黑客 达到 邪恶 的 目的 ， 又 可 以 产生 和 原来 的 输入 一 
样 的 散 列 一 一 这 个 黑客 就 不 需要 你 的 私 钥 了 。 因 为 这 个 黑客 的 输入 产生 了 和 你 的 输入 一 样 
的 散 列 值 ， 而 且 你 已 经 用 你 的 私 钥 对 这 个 散 列 进行 了 签名 ， 所 以 这 个 黑客 只 要 简单 地 将 Jar 
文件 中 的 你 签名 后 的 散 列 加 到 他 的 输入 后 就 可 以 了 。 怎 样 才 能 防止 黑客 采用 这 种 方法 呢 ? 
然而 对 于 黑客 来 说 ， 这 样 的 方法 会 花 去 大 量 的 时 间 ， 因 此 几乎 是 不 可 行 的 。 

因为 单 向 散 列 算法 是 从 大 量 数 据 ( 输 入 ) 中 产生 少量 数据 (消息 摘要 或 者 散 列 )， 所 以 不 同 
的 输入 可 能 产生 相同 的 散 列 。 单 向 散 列 算法 倾向 于 充分 随机 地 分 布 相同 散 列 的 输入 ， 从 而 
使 产生 相同 散 列 值 的 概率 主要 依赖 于 散 列 的 大 小 。 例 如 ， 如 果 使 用 了 一 个 长 8 位 的 散 列 
值 ， 散 列 算法 最 多 产生 256 个 不 同 的 散 列 值 。 如 果 有 一 个 JAR 文件 ， 它 的 散 列 值 是 100， 
然后 你 开始 将 这 个 8 位 的 散 列 算法 在 其 他 Jar 文件 上 运用 ， 毫 无 疑问 ， 每 进行 大 约 256 次 
计算 就 可 能 得 到 一 个 值 为 100 的 散 列 。 如 果 散 列 的 位 数 越 多 ， 产 生 相 同 散 列 值 的 情况 就 越 
不 可 能 发 送 。 在 实际 情况 中 ， 普 遍 采用 的 是 64 位 或 128 位 的 散 列 ， 通 常 认为 这 个 长 度 已 
经 足够 了 ， 这 时 要 想 从 一 个 不 同 的 输入 中 产生 一 个 相同 的 散 列 的 计算 是 不 可 行 的 ， 因 此 防 
止 黑客 用 恶意 输入 蔡 换 我 们 的 善意 输入 ， 并 且 产 生 相 同 的 散 列 值 的 主要 障碍 是 他 必须 花费 
大 量 的 时 间 和 资源 才能 找到 这 个 恶意 的 输入 。 

在 产生 散 列 值 并 用 私 钥 对 它 签名 之 后 ， 随 后 一 个 步骤 就 是 将 这 个 加 密 后 的 散 列 值 加 到 
同一 个 Jar 文件 中 ， 这 个 Jar 文件 还 包含 了 你 最 初 产生 这 个 散 列 的 文件 。 这 样 一 个 经 过 签名 
尔 的 私 钥 加 密 
过 的 散 列 值 (由 输入 产生 )。 加 密 的 散 列 代表 了 你 对 在 同一 个 Jar 文件 中 的 类 和 数据 文件 的 数 
字 签 名 。 

要 想 认证 一 个 已 签名 的 Jar 文件 ， 接 收 者 必须 用 公 钥 对 签名 散 列 进行 解密 ， 得 到 的 结 
果 应 该 和 从 Jar 文件 计算 而 得 到 的 散 列 值 相等 。 为 了 验证 一 个 Jar 文件 在 签名 后 未 被 改动 ， 
接收 者 只 要 对 Jar 文件 的 内 容 实施 单 向 散 列 算法 ， 就 像 在 签名 过 程 中 所 做 的 那样 。( 记 住 ， 
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并 没有 对 Jar 文件 的 内 容 进 行 加 密 ， 所 以 任何 人 都 可 以 看 见 它 。 你 只 是 将 一 个 数字 签名 加 
到 了 那个 Jar 文件 中 ) 如 果 得 到 的 散 列 值 和 加 密 的 散 列 值 匹 配 ， 那 么 接收 者 就 可 以 推断 ， 你 
确实 为 Jar 文件 进行 了 担保 。 而 且 这 个 Jar 文件 的 内 容 在 加 上 你 的 签名 后 没有 被 改动 过 。 这 
个 Jar 文件 中 包含 的 代码 就 可 以 被 放 在 一 个 不 严格 的 沙 箱 中 ， 这 个 沙 箱 信任 你 的 签名 。 

尽管 最 初 在 Java 1.1 版 本 中 引入 的 认证 技术 利用 了 可 信赖 的 数学 原理 ， 但 是 数学 并 不 
能 解决 所 有 问题 ， 其 实 Java 的 认证 技术 引发 了 许多 问题 。 例 如 认证 技术 没有 说 明 应 该 信任 
谁 ， 以 及 对 他 们 的 信任 程度 等 问题 。 由 这 个 认证 技术 引起 了 另 一 个 和 公 钥 的 发 布 有 关 的 问 
题 。 虽 然 最 初 这 看 起 来 很 奇怪 ， 但 是 在 认证 技术 中 将 公开 公 钥 ， 这 种 假设 本 身 就 产生 了 一 
些 安全 问题 。 公 和 钥 发 布 的 困难 是 无 论 采 取 何 种 通信 方式 ， 消 息 ( 即 公 钥 ) 可 能 潜在 地 被 算 改 
或 偷偷 替换 。 当 我 们 访问 页 面 时 可 能 被 截取 并 涂改 了 。 

为 了 解决 公 钥 发 布 的 困难 ， 特 地 建立 了 许多 证 书 机 构 为 这 些 公 钥 做 担保 。 


3.4.2 ”代码 签名 示例 


为 了 说 明 Java 虚拟 机 的 签名 机 制 ， 在 接 下 来 的 内 容 中 ， 将 通过 一 个 简单 的 示例 来 说 明 
为 代码 签名 的 运作 流程 。 在 本 示例 中 有 三 个 类 型 : Doer、Friend 和 Stranger。 其 中 第 一 个 
类 型 Doer 定义 了 另外 两 种 类 型 (类 Friend 和 类 Stranger) 实 现 的 接口 : 


packagecom.artime.security.doer; 
public interface Doer { 

void doYourThing(); 
. 


Doer 仅 声明 了 一 个 方法 doYourThing0， 类 Friend 和 类 Stranger 用 相似 的 方式 实现 了 
这 个 方法 。 实 际 上 除了 名 字 不 同 以 外 ， 在 本 质 上 这 两 种 方法 是 一 样 的 : 


packagecom.artime.security.friend; 
importjava.security.AccessController; 
importjava.security.PrivilegedAction; 
importcom.artime.security.doer.Doer; 
public class Friend implements Doer { 
private Doer next; 
private boolean direct; 
public Friend(Doernext, boolean direct) { 
this.next = next; 
this.direct = direct; 
} 
QOverride 
public void doYourThing() { 
if (direct) { 
next .doYourThing (); 
}else { 


AccessController.doPrivileged (newPrivilegedAction<Friend>() { 
public Friend run() { 
next .doYourThing (); 
return null; 
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} 
} 
packagecom.artime.security.stranger; 
importjava.security.AccessController; 
importjava.security.PrivilegedAction; 
importcom.artime.security.doer.Doer; 
public class Stranger implements Doer { 
private Doer next; 
private boolean direct; 
public Stranger (Doernext, boolean direct) { 
this.next = next; 
this.direct = direct; 
; 
@Override 
public void doYourThing() { 
LE (direct) ft 
next .doYourThing (); 
}else { 


AccessController.doPrivileged (newPrivilegedAction<stranger>() { 
public stranger run(){ 
next .doYourThing (); 
return null; 


} 

上 述 三 种 类 型 Doer、Friend 和 Stranger 是 为 了 说 明 访问 控制 的 栈 检查 机 制 而 专门 推出 
的 。 在 本 章 后 面 将 给 出 一 些 栈 检查 的 例子 ， 到 那 时 读者 就 会 真正 理解 推出 它们 的 目的 。 在 
这 里 通过 编译 Friend 和 Stranger 而 产生 的 class 文件 必须 被 签名 ， 目 的 是 以 便 在 以 后 的 栈 
检查 的 例子 中 使 用 它 。 从 Friend.java 产生 的 class 文件 将 由 一 个 比较 信任 的 称 为 “friend” 
的 团体 签名 ， 而 从 文件 Strangerjava 产生 的 class 文件 将 由 一 个 不 太 信 任 的 称 为 

“stranger” 的 团体 签名 ， 而 由 Doer 产生 的 class 文件 不 用 签名 。 

在 这 些 文件 被 签名 以 前 ， 我 们 必须 将 它们 放 入 Jar 文件 中 。 因 为 Friend 和 Stranger 的 
class 文件 将 被 两 个 不 同 的 团体 签名 ， 所 以 它们 将 被 放置 在 两 个 不 同 的 Jar 文件 中 。 通 过 编 
译文 件 Friend.java 产生 的 两 个 class 文件 Friend.class 和 Friend$1.class， 将 被 放置 在 一 个 名 
为 friend.jar 中 ; 同样 由 编译 Strangerjava 产生 的 两 个 class 文件 Stranger.class 和 
Stranger$l.class， 将 被 放 到 一 个 名 为 strangerjar 的 Jar 文件 中 。 

Friendjava 的 class 文件 被 javac 编译 器 放 到 了 目录 security/ex2/com/ 
artima/security/friend 下 ， 因 为 类 Friend 在 包 com.artima.security.friend 中 被 声明 ， 文 件 
Friend.java 的 class 文件 必须 被 放置 在 com/artima/security/friend 目录 下 的 Jar 文件 中 。 在 
security/ex2 目录 下 执行 下 面 的 命令 ， 将 会 把 Friend.class 和 Friend$1.class 放 到 一 个 新 建 的 
名 为 friendjar 的 Jar 文件 中 ， 此 Jar 文件 被 放 在 了 当前 目录 security/ex2 下 : 


jar cvf friend.jarcom/artima/security/friend/*.class 


CE 
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当 执 行 完 上 面 的 命令 后 ， 必 须 删除 Friend.java 的 class 文件 ， 以 便 Java 虚拟 机 在 运行 
下 面 的 访问 控制 的 例子 时 无 法 找到 它 : 

rmcom/artima/security/friend/Friend.class 

rmcom/artima/security/friend/Friend$1.class 

Stranger.java 的 class 文件 被 javac 放 在 了 security/ex2/com/artima/secutiry/stranger 目录 
下 ， 将 它 放 入 一 个 Jar 文件 的 过 程 和 上 面 的 过 程 相同 。 在 security/ex2 目录 下 执行 如 下 
命令 : 


jar cvfstranger.jar com/artima/security/stranger/*.class 
rmcom/artima/security/stranger/Sstranger.class 
rmcom/artima/security/stranger/stranger$1.class 


为 了 用 jarsigner 工具 对 Jar 文件 进行 签名 ， 在 keystore 文件 中 必须 存储 签名 者 个 “ 公 
钥 / 私 钥 ” 对 ， 这 个 文件 用 来 存储 已 命名 的 、 受 密码 保护 的 密 钥 。 使 用 keytool 程 可 以 生成 
新 的 密 钥 对 ， 并 且 将 这 个 密 钥 对 和 一 个 名 称 相关 联 ， 并 且 用 密码 将 它们 保护 起 来 ， 这 个 别 
名 在 每 一 个 keystore 文件 中 都 是 独立 的 ， 用 于 在 一 个 特定 的 keystore 文件 中 识别 一 个 特定 
的 密 钥 对 。 要 想 访 问 或 者 修改 包含 在 keystore 文件 中 的 密 钥 对 的 信息 ， 必 须 拥 有 这 个 密 钥 
对 的 密码 。 

这 个 访问 控制 的 例子 需要 在 security/ex2 目录 下 的 名 为 ivijmkeys 的 Keystore 文件 ， 这 
个 文件 中 包含 别名 为 “friend” 和 “stranger” 的 两 个 密 钥 对 。 在 security/ex2 目录 下 运行 下 
面 的 命令 ， 将 为 别名 friend 产生 密码 为 friend4life 的 密 钥 对 。 在 这 个 过 程 中 将 产生 一 个 名 
为 ijvmkeys 的 keystore 文件 : 


Keytool -genkey -alias friend -keypass friend4life-validity 10000 — 
keystore ijvmkeys 


在 上 述 keytool 命令 中 ， 命 令 行 参 数 “-validity 10000” 表 示 这 个 密 钥 对 将 在 10000 天 
之 内 有 效 。 当 命令 运行 时 ， 它 将 产生 一 个 keystore 密码 ， 在 对 这 个 keystore 文件 进行 任意 
访问 或 修改 时 都 需要 这 个 keystore 密码 ， 赋 给 jjvmkeys 的 密码 是 ijjvm2ed。 

我 们 可 以 用 如 下 类 似 的 命令 为 stranger 生成 密 钥 对 : 


Jarsigner -keystore ljvmkeys -storepass ijvm2ed -keypass 
stranger4lifestranger.jar stranger 


为 了 对 两 个 Jar 文件 进行 签名 ， 必 须 做 上 面 的 工作 。 值 得 注意 的 是 ， 在 现实 中 必须 确 
保 不 要 让 那些 意图 不 轨 的 人 得 到 你 的 私 铀 ， 并 要 和 他 们 保持 距离 。 这 就 意味 着 你 不 能 丢失 
这 个 keystore 文件 ， 必 须 记 住 密码 。 而 且 ， 还 必须 让 那些 试图 用 你 的 签名 来 让 我 们 的 代码 
访问 它们 的 系统 的 人 得 到 你 的 公 钥 。 


3.5 ”策略 机 制 和 保护 域 


策略 机 制 和 保护 域 是 实现 虚拟 机 安全 性 的 因素 之 一 ， 本 节 将 详细 讲解 策略 机 制 和 保护 
域 的 基本 知识 ， 为 读者 学 习 本 书后 面 的 知识 打下 基础 。 


PE OO p> 


人 
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3.5.1 分 析 Java 的 策略 机 制 


在 本 书 前 面 的 内 容 中 曾经 提 到 过 ， 沙 箱 安全 模型 的 最 大 的 优点 之 一 是 可 以 是 用 户 自 定 
义 的 。 通过 从 Java 1.1 版 本 就 已 经 引入 的 代码 签名 和 认证 技术 ， 使 正在 运行 的 应 用 程序 可 
以 对 代码 区 分 不 同 的 信任 度 。 通 过 自 定 义 沙 箱 ， 被 信任 的 代码 可 以 比 不 可 靠 的 代码 获得 更 
多 的 访问 系统 资源 的 权限 。 这 就 防止 了 不 可 靠 代码 访问 系统 ， 但 是 却 允 许 被 信任 的 代码 访 
问 系统 并 进行 工作 。Java 安全 体系 结构 的 真正 好 处 在 于 ， 它 可 以 对 代码 授予 不 同 层次 的 信 
任 度 来 部 分 地 访问 系统 。 

Microsoft 提供 了 ActiveX 控件 认证 技术 ， 它 和 Java 的 认证 技术 相 类似 ， 但 是 ActiveX 
控件 并 不 在 沙 箱 中 运行 。 这 样 使 用 了 ActiveX， 一 系列 移动 代码 要 么 是 被 完全 信任 的 ， 要 
么 是 完全 不 被 信任 的 。 如 果 一 个 ActiveX 控件 不 被 信任 ， 则 它 将 被 拒绝 执行 。 虽 然 这 对 于 
没有 认证 来 说 是 一 个 很 大 的 提高 ， 但 是 如 果 一 些 恶 意 的 或 是 有 漏洞 的 代码 得 到 了 认证 ， 这 
段 危险 的 代码 将 拥有 对 系统 的 完全 访问 权 。Java 的 安全 体系 结构 的 优点 之 一 就 是 ， 代 码 可 
以 被 授予 只 对 它 需 要 的 资源 进行 访问 的 有 限 权限 。 即 使 一 些 恶意 的 或 者 有 漏洞 的 代码 得 到 
了 认证 ， 它 也 很 少 有 机 会 进行 破坏 。 例 如 ， 一 段 恶 意 的 或 者 有 漏洞 的 代码 可 能 只 能 删除 一 
个 固定 目录 下 的 为 它 设置 的 文件 ， 而 不 是 在 本 地 硬盘 上 的 所 有 文件 。 

从 1.2 ee sori ibe tt 
控制 策略 ， 这 样 不 但 过 程 更 为 简单 而 且 更 少 出 错 。 为 了 将 不 同 的 系统 访问 权限 授予 不 同 的 
代码 单元 ，Java 的 访问 控制 机 制 必须 能 确认 应 该 给 每 个 代码 段 授予 什么 样 的 权限 。 为 了 使 
这 个 过 程 变 得 容易 ， 载 入 1.2 版 本 或 其 他 虚拟 机 的 每 一 个 代码 段 (每 个 class 文件 ) 将 和 一 个 
代码 来 源 关 联 。 代 码 来 源 主要 说 明了 代码 从 哪里 来 ， 如 果 它 被 某 个 人 签名 担保 的 话 ， 是 从 
谁 那里 来 。 在 1.2 版 本 以 后 的 安全 模型 中 ， 权 限 (系统 访问 权限 ) 是 授 给 代码 来 源 的 。 因 此 如 
果 代 码 段 请 求 访问 一 个 特定 的 系统 资源 ， 只 有 当 这 个 访问 权限 是 和 那 段 代 码 的 代码 来 源 相 
关联 时 ，Java 虚拟 机 才 会 把 对 那个 资源 的 访问 权限 授予 这 段 代 码 。 

在 1.2 版 本 的 安全 体系 结构 中 ， 对 应 于 整个 Java 应 用 程序 的 一 个 访问 控制 策略 是 由 抽 
象 类 java.security.Policy 的 一 个 子 类 的 单个 实例 所 表示 的 。 在 任何 时 候 ， 每 一 个 应 用 程序 实 
际 上 都 只 有 一 个 Policy 对 象 。 获 得 许可 的 代码 可 以 用 一 个 新 的 Policy 对 象 替 换 当 前 的 
Policy 对 象 ， 这 是 通过 调用 Policy.setPolicy0 并 把 一 个 新 的 Policy 对 象 的 引用 传递 给 它 来 实 
现 的 。 类 装载 器 利用 这 个 Policy 对 象 来 帮助 它们 决定 ， 在 把 一 段 代 码 导 入 虚拟 机 时 应 该 给 
它们 什么 样 的 权限 。 

安全 策略 是 一 个 从 描述 运行 代码 的 属性 集合 到 这 段 代码 所 拥有 的 权限 的 映射 。 在 1.2 
版 本 的 安全 体系 结构 中 ， 描 述 运行 代码 的 属性 被 总 称 为 代码 来 源 。 一 个 代码 来 源 是 由 一 个 
java.security.CodeSource 对 象 表示 的 ， 这 个 对 象 中 包含 了 一 个 java.net.URL， 它 表示 代码 库 
和 代表 了 签名 者 的 零 个 或 多 个 证 书 对 象 的 数组 。 证 书 对 象 是 抽象 类 java.security.Certificate 
的 子 类 的 一 个 实例 ， 一 个 Certificate 对 象 抽象 表示 了 从 一 个 人 到 一 个 公 钥 的 绑 定 ， 以 及 另 
一 个 为 这 个 绑 定 作 担保 的 人 (以 前 提 过 的 证 书 机 构 )。CodeSource 对 象 包含 了 一 个 Certificate 
对 象 的 数组 ， 因 为 同一 段 代码 可 以 被 多 个 团体 签名 (担保 )。 这 个 签名 通常 是 从 Jar 文件 中 获 
得 的 。 
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从 1.2 版 本 开始 ， 所 有 和 具体 安全 管理 器 有 关 的 工具 和 访问 控制 体系 结构 都 只 能 对 证 
书 起 作用 ， 而 不 能 对 公 钥 起 作用 。 如 果 附 近 没有 证 书 机 构 ， 可 以 用 私 钥 对 公 钥 签名 ， 生 成 
一 个 自 签名 的 证 书 。 当 使 用 keytool 程序 生成 密 钥 时 ， 总 是 会 产生 一 个 自 签名 的 证 书 。 例 
如 在 上 一 节 的 签名 例子 中 ，keytool 不 仅 产生 了 “ 公 钥 / 私 铀 ”对 ， 而 且 还 为 别名 friend 和 
stranger 产生 了 自 签 名 的 证 书 。 

权限 是 用 抽象 类 java.security. Permission 的 一 个 子 类 的 实例 表示 的 。 一 个 Permission 对 
象 有 三 个 属性 ， 分 别 是 类 型 、 名 字 和 可 选 的 操作 。 权 限 的 类 型 是 由 Permisstion 类 的 名 字 指 
定 的 ， 例 如 java.io.FilePermission、java.net.SocketPermission 和 java.awtAWTPermission 。 
权限 的 名 字 是 封装 在 Permission 对 象 内 的 。 例 如 某 个 FilePermission 的 名 字 可 能 是 
/my/finances.dat ， 某 个 SocketPermission 的 名 字 可 能 是 applets.artima.com:2000， 某 个 
AWTPermission 的 名 字 可 能 是 showWindowWithoutBannerWarming。Permission 对 象 的 第 三 
个 属性 是 它 的 动作 。 并 不 是 所 有 的 权限 都 有 动作 。 例 如 ，FilePermission 的 动作 是 

“read,write”，SocketPermission 的 动作 是 “accept,connect”。 如 果 一 个 FilePermission 的 
名 字 为 /my/finances.dat， 并 且 有 动作 “read,write”， 那 么 它 就 表示 对 文件 /my/finance.dat 可 
以 进行 读 写 操作 ， 名 字 和 动作 都 是 由 字符 串 来 表示 的 。 

Java API 有 一 个 很 大 的 权限 层次 结构 ， 在 里 面 表示 了 所 有 可 能 潜在 危险 的 操作 。 可 以 
根据 自己 的 目的 创建 自己 的 Permission 类 来 表示 自 定义 的 权限 ， 例 如 可 以 创建 一 个 
Permission 类 来 表示 对 属性 数据 库 的 特定 记录 的 访问 权限 。 定 义 自 定义 的 Permission 类 也 
是 一 种 扩展 版 本 1.2 的 安全 机 制 类 满足 自己 需要 的 方法 。 如 果 创 建 了 自己 的 Permission 
类 ， 可 以 像 使 用 Java API 中 的 Permission 类 一 样 来 使 用 它们 。 

在 Policy 对 象 中 ， 每 一 个 CodeSource 是 和 一 个 或 多 个 Permission 对 象 相关 联 的 。 和 一 
个 CodeSource 相关 联 的 Permission 对 象 被 封装 在 java.security.PermissionCollection 的 一 个 
子 类 实例 中 。 类 装载 器 可 以 调用 Policy.getPolicy() 来 获得 一 个 当前 有 效 的 Policy 对 象 的 引 
用 。 然 后 它们 可 以 调用 Policy 对 象 的 getPermission0 方 法 ， 传 入 一 个 CodeSource， 从 而 得 
到 和 那个 CodeSource 对 应 的 Permission 对 象 的 PermissionCollection。 类 装载 器 然后 可 以 使 
用 这 个 从 Policy 对 象 中 得 到 的 PermissionCollection 来 帮助 判断 应 该 给 导入 的 代码 授予 什么 
权限 。 


3.5.2 ”分析 策略 文件 


Java.security.Policy 是 一 个 抽象 类 ，Policy 子 类 的 实现 细节 之 一 就 是 该 子 类 的 实例 怎样 
知道 策略 应 该 是 什么 。 在 此 子 类 中 可 以 采取 多 种 方法 ， 例 如 ， 对 一 个 已 序列 化 的 Policy 对 
象 进行 优化 ， 从 数据 库 中 抽取 策略 ， 或 者 从 文件 中 读 取 策略 。 在 Sun 提供 的 具体 Policy 子 
类 中 ， 在 一 个 ASCII 策略 文件 中 用 上 下 文 无 关 文 法 描述 安全 策略 。 

一 个 策略 文件 包括 了 一 些 列 grant 子 句 ， 每 一 个 grant 子 句 将 一 些 权 限 授 给 一 个 代码 来 
源 。 我 们 知道 一 个 代码 来 源 包含 了 一 个 代码 库 和 一 系列 签名 ,代码 库 是 指出 这 个 代码 从 那 
里 下 载 的 URL。 在 策略 文件 中 ， 签 名 用 别名 来 代表 ， 这 些 签名 是 保存 keystore 文件 中 的 签 
名 者 的 公 钥 。 这 个 keystore 可 以 在 策略 文件 中 用 一 个 keystore 语句 显 式 说 明 。 一 个 典型 策 
略 文件 的 例子 是 security/ex2 目录 下 的 文件 policyfile txt: 


生硬 和 和 人 过 六 


KE. 


Cn 以 机 开发 : 
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Keystore "ijvmkeys"; 

grant signedBy "friend" { 
permission java.io.FilePermission "question.txt","read"; 
permission java.io.FilePermission "answer.txt","read"; 

3 

grant signedBy "stranger"{ 
permission java.io.FilePermission "question.txt", "read"; 

] 7 

grant codebase "file:${com.artima.ijvm.cdrom.home}/security/ex2/*"{ 
permission java.io.FilePermission "question.txt", "read"; 
permission java.io.FilePermission "answer.txt", "read"; 

}; 


在 上 述 Policyfile.txt 文件 中 ， 其 中 第 一 条 语句 是 keystore 语句 : 
Keystore "ijvmkeys"; 


上 述 keystore 语句 说 明 ， 密 钥 别 名 (策略 文件 其 余部 分 将 提 到 ) 指 向 存储 在 名 为 
ijvmkeys 的 文件 中 的 证 书 。 因 为 这 个 文件 名 没有 包含 路 径 ， 这 个 文件 必须 是 存储 在 当前 目 
录 下 一 一 java 应 用 程序 使 用 该 策略 文件 的 启动 目录 。 

上 述 策略 文件 中 的 第 二 条 语句 是 一 条 grant 语句 : 

grant signedBy "friend" { 

permission java.io.FilePermission "question.txt","read"; 
permission java.io.FilePermission "answer.txt","read"; 

}; 

上 述 语句 将 授予 由 别名 为 friend 的 实体 签名 的 所 有 代码 两 个 权限 。 被 授予 的 权限 是 : 
读 取 question.txt 文件 的 权限 ， 以 及 读 取 answer.txt 文件 的 权限 。 因 为 这 些 文件 名 没有 路 
径 ， 所 以 它们 必须 是 存储 在 当前 目录 下 的 ， 也 就 是 这 个 应 用 程序 的 启动 目录 。 因 为 这 个 
grant 子 句 中 没有 提 到 代码 库 ， 所 以 由 friend 签名 的 代码 可 以 来 自任 何 代码 库 。 任 何 由 
friend 签名 的 代码 ， 不 管 是 来 自 哪个 代码 库 的 ， 都 将 被 授予 对 question.txt 和 answer.txt 进 
行 读 操作 的 权限 。 

文件 Policyfile.txt 中 的 第 三 个 语句 也 是 一 条 grant 语句 ， 和 上 一 条 语句 的 形式 类 似 : 

grant signedBy "stranger"1{ 

permission java.io.FilePermission "question.txt", "read"; 

] 7 

上 述 语句 将 授予 所 有 由 别名 为 stranger 的 公司 或 个 人 签名 的 代码 以 下 权限 : 读 取 名 为 
question txt 的 文件 的 权限 。 这 个 文件 必须 位 于 当前 目录 下 ， 也 就 是 这 个 应 用 程序 的 启动 目 
录 。 因 为 在 这 条 grant 语句 中 没有 提 到 代码 库 ， 所 以 来 自 所 有 代码 库 的 代码 ， 只 要 是 由 
stranger 签名 的 ， 都 可 以 得 到 读 question.txt 的 权限 。 注 意 ， 虽 然 stranger 已 经 被 允许 读 取 
question txt 中 的 问题 ， 但 是 stranger 不 能 看 到 answer 中 的 答案 。 而 授予 friend 的 权限 正好 
相反 ， 它 可 以 读 取 所 有 的 问题 以 及 答案 。 

在 策略 文件 中 的 第 四 条 ， 也 是 最 后 一 条 语句 仍然 是 一 个 grant 语句 : 


grant codebase "file:${com.artima.ijvm.cdrom.home}/security/ex2/*"{ 
permission java.io.FilePermission "question.txt"，"read"7 
permission java.io.FilePermission "answer.txt", "read"; 

ER 
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上 述 grant 语句 将 两 个 权限 授 给 所 有 从 一 个 特定 目录 中 装载 的 代码 ， 对 文件 
question txt 的 读 权 限 以 及 对 文件 answer.txt 的 读 权限 。 这 两 个 文件 都 必须 在 当前 目录 下 ， 
也 就 是 这 个 应 用 程序 的 启动 目录 。 这 个 grant 子 句 没有 指明 任何 签名 者 ， 所 以 这 个 代码 可 
以 是 被 任何 人 签名 的 ， 或 者 是 未 被 签名 的 。 只 要 它 是 从 指定 的 目录 下 被 装载 的 ， 它 就 可 以 
被 授予 上 面 所 列 出 的 权限 。 

上 述 grant 语句 中 的 代码 库 URL 采用 了 文件 的 形式 ， 它 包含 了 一 个 属性 


${com.artima.ijvm.cdrom.home}。 


3.5.3 ”保护 域 


当 类 装载 器 将 类 型 装 入 Java 虚拟 机 时 ， 会 为 每 个 类 型 指派 一 个 保护 域 。 保 护 域 定义 了 
授予 一 段 特 定 代码 的 所 有 权限 ， 一 个 保护 域 对 应 于 策略 文件 中 的 一 个 或 多 个 Grant 子 句 。 
装载 入 Java 虚拟 机 的 每 一 个 类 型 都 属于 一 个 、 且 仅 属 于 一 个 保护 域 。 

类 装载 器 知道 它 装载 的 所 有 类 或 接口 的 代码 库 和 签名 者 ， 利 用 这 些 信息 来 创建 一 个 
CodeSource 对 象 。 它 将 这 个 CodeSource 对 象 传递 给 当前 Policy 对 象 的 getPermissions() 方 
法 ， 得 到 这 个 抽象 类 java.security.PermissionCollection 的 子 类 实例 。 此 PermissinCollection 
包含 了 到 所 有 Permission 对 象 的 引用 ， 这 些 Permission 对 象 由 当前 策略 授予 指定 代码 来 
源 。 利 用 它 创 建 的 CodeSource 和 从 Policy 对 象 得 到 的 PermissionCollection， 可 以 实例 化 一 
个 新 的 ProtectDomain 对 象 。 它 通过 将 合适 的 ProtectionDomain 对 象 传递 给 defineClass() 方 
法 ， 来 将 这 段 代 码 放 到 一 个 保护 域 中 。 方 法 DefineClass0 是 类 ClassLoader 的 一 个 实例 方 
法 ， 用 户 自 定义 类 装载 器 调用 它 来 将 类 型 导入 到 Java 虚拟 机 中 。 将 类 型 指派 到 保护 域 中 是 
一 个 重要 的 工作 ， 就 像 在 本 章 前 面 提 到 的 一 样 ， 它 是 类 装载 器 体系 结构 支持 Java 沙 箱 安全 
模型 的 三 个 方法 中 的 一 个 。 

虽然 这 个 Policy 对 象 代表 了 一 个 从 代码 来 源 到 权限 的 全 局 映射 但 是 最 终 还 是 由 类 装 
载 器 负责 决定 代码 执行 时 将 获得 什么 样 的 权限 。 例 如 一 个 类 装载 器 可 以 完全 忽略 当前 的 策 
略 ， 而 随机 地 赋予 权限 。 或 者 ， 一 个 类 装载 器 可 以 向 由 policy 对 象 的 getPermissions() 方 法 
返回 的 权限 中 再 添加 一 些 权限 。 例 如 ， 如 果 一 个 类 型 装载 器 要 装载 一 个 applet 代码 ， 除 了 
由 当前 策略 可 能 授予 这 段 代码 的 权限 以 外 ， 它 还 可 以 添加 一 个 权限 ， 使 得 它 可 以 建立 一 个 
到 这 个 applet 的 源 主机 的 socket 连接 。 现 在 读者 可 以 明白 了 ， 类 装载 器 在 装载 类 时 起 到 了 
重要 的 安全 作用 。 


3.6 ”访问 控制 器 


类 java.security.AccessController 提供 了 一 个 默认 的 安全 策略 执行 机 制 ， 它 使 用 栈 检查 
来 决定 潜在 不 安全 的 操作 是 否 被 允许 。 这 个 访问 控制 器 不 能 被 实例 化 ， 它 不 是 一 个 对 象 ， 
而 是 集合 在 单个 类 中 的 多 个 静态 方法 。AccessController 的 最 核心 方法 是 它 的 静态 方法 
checkPermission()， 这 个 方法 决定 一 个 特定 的 操作 能 否 被 允许 。 这 个 方法 将 指向 Permission 
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对 象 的 引用 作为 唯一 的 参数 ， 并 返回 void。 和 安全 管理 器 中 的 check 方法 相 类 似 ， 如 果 
AccessController 确定 这 个 操作 被 允许 ， 它 的 checkPermission() 方 法 将 简单 地 返回 ， 但 是 如 
果 AccessController 确定 一 个 操作 被 禁止 ， 它 的 checkPermission() 方 法 将 异常 中 止 ， 并 抛 出 
一 个 AccessControlException， 或 者 是 它 的 一 个 子 类 。 

在 本 章 前 面 曾经 提 到 过 ， 安 全 管理 器 中 的 老式 check 方法 (例如 checkRead() 和 
checkWriteO) 实 现 的 只 是 简单 的 实例 化 一 个 合适 的 Permission 对 象 ， 并 且 调 用 具体 安全 管 
理 器 的 checkPermission() 方 法 。 这 个 具体 安全 管理 器 方法 checkPermission() 简 单 地 调用 了 
AccessController 中 的 方法 checkPermission()。 因 此 如 果 安 装 了 具体 安全 管理 器 ， 其 实 最 终 
是 由 这 个 AccessController 来 决定 一 个 潜在 不 安全 的 方法 是 否 被 允许 。 

根据 AccessController 的 checkPermission() 实 现 的 算法 ， 可 以 决定 调用 栈 中 的 每 个 帧 是 
否 有 权 执 行 潜在 不 安全 的 操作 。 每 一 栈 帧 代表 了 由 当前 线程 调用 的 某 个 方法 ， 每 一 个 方法 
是 在 某 个 类 中 定义 的 ， 每 一 个 类 又 属于 某 个 保护 域 ， 每 个 保护 域 包含 一 些 权 限 。 因 此 ， 每 
个 栈 帧 间接 地 和 一 些 权 限 相 关 。 为 了 使 传递 给 AccessController 的 checkPermission() 方 法 的 
Permission 对 象 所 代表 的 操作 被 多 许 ， 这 个 AccessController 的 基本 算法 要 求 ， 和 调用 栈 上 
的 每 个 帧 相关 联 的 权限 必须 包含 或 隐 含 传 给 checkPermission() 的 Permission 对 象 。 

AccessController 的 checkPermission() 方 法 自 顶 向 下 检查 栈 ， 只 要 它 遇 到 一 个 没有 权限 
的 帧 ， 它 将 抛 出 一 个 AccessControlException。 通 过 抛 出 这 个 异常 ，AccessController 指明 这 
个 操作 不 能 被 允许 。 相 反 ， 如 果 checkPermission() 方 法 到 达 栈 的 底部 ， 也 没有 遇 到 这 种 栈 
帧 ( 即 无 权限 执行 潜在 不 安全 操作 ) 的 情况 ，checkPermission() 方 法 将 简单 地 返回 。 通 过 简单 
返回 而 不 是 抛 出 异常 ，AccessController 指明 这 个 操作 可 以 被 允许 。 


3.6.1 implies() 方 法 


为 了 决定 由 传递 给 AccessController 的 checkPermission() 方 法 的 Permission 对 象 所 代表 
的 操作 ， 是 否 包含 在 (或 隐 含 在 ) 和 调用 栈 中 的 代码 相关 联 的 权限 中 ，AccessController 利用 
了 一 个 名 为 impliesO 的 重要 方法 。 这 个 implies() 方 法 是 在 Permission 类 以 及 
PermissionCollection 类 和 ProtectionDomain 类 中 声明 的 。Implies() 将 一 个 Permission 对 象 作 
为 它 唯 一 的 参数 ， 返 回 一 个 布尔 值 true 或 false。Permission 类 的 implies0 方 法 确定 由 
Permission 对 象 所 代表 的 权限 ， 是 否 在 本 质 上 隐 含 在 由 一 个 不 同 的 Permission 对 象 所 代表 
的 权限 中 。PermissionCollection 和 ProtectionDomain 的 implies() 方 法 确认 了 一 个 被 传递 的 
Permission 是 否 包含 或 隐 含 在 封装 在 PermissionCollection 或 ProtectionDomain 中 的 
Permission 对 象 集合 中 。 

例如 ， 读 取 /tmp 目录 下 所 有 文件 的 权限 本 质 上 隐 含 了 读 取 /tmp 目录 下 特定 文件 /tmp/f 
的 权限 ， 反 过 来 则 不 成 立 。 如 果 你 询问 一 个 代表 了 读 取 /tmp 目录 下 的 所 有 文件 的 权限 的 
FilePermission 对 象 ， 它 是 否 隐 含 了 读 取 文件 /imp 上 f 的 权限 ， 方 法 implies0 将 返回 true。 但 
是 如 果 询 问 一 个 代表 了 读 取 /tmp/f 权限 的 FilePermission 对 象 是 否 隐 含 了 读 取 /tmp 下 任何 文 
件 的 权限 时 ， 方 法 implies0 将 返回 false。 


package com; 
import java.io.File; 
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importjava.io.FilePermission; 
importjava.security.Permission; 
public class Examplel { 
public static void main(String[]args) { 
char sep = File.separatorChar; 
// readpermission for /tmp/f 
Permissionfile = new FilePermission(sep + "tmp" + sep + "f", 
"read")? 
// readpermission for /tmp/* which means all files in the /tmp 
// directory 
Permissionstar = new FilePermission(sep + "tmp" + sep + "*", 
"read"); 
boolean starImpliesFile= star.implies (file); 
boolean fileImpliesStar= file.implies (star); 


// print"star implies file = true" 
System.out.println("Starimplies file = " + starImpliesFile); 
// print"file implies Star = false" 
System.out .println("file implies Star = " 
+fileImpliesStar) 7 
} 
} 
上 述 应 用 程序 定义 了 类 Examplel， 在 里 面 创建 了 两 个 FilePermission 对 象 ， 一 个 代表 
对 特定 目录 的 读 权限 ， 另 一 个 代表 对 同一 个 目录 下 的 特定 文件 的 读 权限 。 这 个 从 局 部 变量 
star 引用 的 FilePermission 对 象 代表 了 读 取 /tmp 下 任何 文件 的 权限 ， 而 从 局 部 变量 file 引用 
的 FilePermission 对 象 代表 了 读 取 文件 /tmp/f 的 权限 ， 在 执行 时 ， 应 用 程序 输出 : 


Star impliesfile 
file impliesstar 


方法 implies() 被 AccessController 确定 一 个 线程 是 否 拥有 进行 某 些 操作 的 权限 。 例 如 ， 

如 果 AccessController 的 checkPermission() 方 法 被 调用 ， 用 以 确定 这 个 线程 是 否 有 权 读 取 文 
件 /tmp/f。 AccessController 将 调用 和 这 个 线程 的 调用 栈 中 的 每 一 个 栈 帧 相关 联 的 
ProtectionDomain 对 象 的 implies() 方 法 。 对 于 每 一 个 implies() 方 法 ，AccessController 将 把 
一 个 FilePermission 对 象 传递 给 它 的 checkPermission() 方 法 ， 这 个 FilePermission 对 象 代表 
了 读 取 文件 /tmp/f 的 权限 。 每 个 ProtectDomain 对 象 的 implies0 方 法 会 调用 它 封 装 的 
PermissionCollection 的 implies(0) 方 法 ， 传 递 给 它 同一 个 FilePermission 。 同 样 ， 每 一 个 
PermissionColletion 会 调用 它 包含 的 Permission 对 象 上 的 implies0) 方 法 ， 再 一 次 传递 这 个 
FilePermission 对 象 的 引用 。 一 旦 PermissinoCollection 的 implies0 方 法 遇 到 了 一 个 
Permission 对 象 ， 如 果 此 permission 对 象 返回 tue， 则 这 个 PermissionCollection 的 implies() 
方法 也 返回 tue。 只 有 当 在 PermissionCollection 中 包含 的 所 有 Permission 对 象 的 implie() 方 
法 都 没有 返回 true 时 ， 此 PermissionCollection 才 返 回 false。ProtectionDomain 的 impliesO 
方法 简单 地 返回 了 PermissionCollection 的 implies() 方 法 的 返回 值 。 如 果 AccessController 从 
与 一 个 特定 栈 帧 相关 联 的 ProtectionDomain 的 implies() 方 法 中 得 到 true 时 ， 这 个 栈 帧 所 代 
表 的 代码 就 拥有 了 执行 这 个 潜在 不 安全 操作 的 权限 。 


七 rue 
false 
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3.6.2 ” 栈 检查 演示 实例 


接 下 来 将 给 出 几 个 演示 实例 ， 说 明 AccessController 执行 栈 检查 的 方法 。 在 下 面 的 演 
示 实 例 中 ， 由 friend 和 Stranger 签名 的 代码 在 一 定 程度 上 被 信任 ， 但 是 使 用 friend 签名 的 
代码 要 比 使 用 stranger 签名 的 代码 的 可 信 度 要 高 。 由 friend 和 stranger 签名 的 代码 都 可 以 拥 
有 读 取 文 件 question.txt 的 权限 ， 在 这 个 文件 中 包含 了 问题 。 由 friend 签名 的 代码 可 以 拥有 
读 取 文 件 answer.txt 的 权限 ， 在 这 个 文件 中 包含 了 回答 question txt 中 的 问题 的 答案 ， 但 是 
使 用 stranger 签名 的 代码 没有 这 个 权限 。 下 面 的 每 一 个 例子 将 采取 policyfile .txt 中 描述 的 
策略 。 


package com.artime.security.doer; 
public interface Doer { 

void doYourThing(); 
} 


为 了 成 为 Doer， 类 必须 提供 一 个 doYourThing() 方 法 的 实现 ， 实 现 Doer 的 类 可 以 在 它 
们 的 doYourThing0) 方 法 中 干 任何 它们 喜欢 的 事 。 例 如 ， 这 里 有 一 个 名 为 TextFileDisplayer 
的 类 ， 它 实现 了 Doer， 它 做 的 “ 事 ” 是 显示 一 个 文本 文件 的 内 容 : 


packagecom.artime.security.doer.impl; 
importjava.io.CharArrayWriter; 
importjava.io.FileNotFoundException; 
importjava.io.FileReader; 
importjava.io.IOException; 
importcom.artime.security.doer.Doer; 
public classTextFileDisplayer implements Doer { 
private string fileName; 
publicTextFileDisplayer (String fileName) { 
this.fileName = fileName; 
} 
public void doYourThing() { 


Ey 
FileReaderfr = new FileReader (this.fileName); 
try { 

CharArrayWritercaw = new CharArrayWriter(); 
int c; 
while ((c =fr.read()) != -1) { 


Caw.write (c); 
} 
System.out .println (caw.tostring()); 
}catch (IOException e){ 
e.printstackTrace (); 
}finallyt{ 
EEy 
fr.close(); 
}catch (IOException e){ 
e.printstackTrace (); 
} 
' 
}catch (FileNotFoundException e) { 
e.printstackTrace (); 
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、 

} 

在 创建 一 个 TextFileDisplayer 对 象 时 ， 必 须 将 一 个 文件 路 径 名 传 给 它 的 构造 器 ， 这 个 
TextFileDisplayer 构造 器 将 把 这 个 路 径 名 存储 在 名 为 filename 的 实例 变量 中 。 当 调用 这 个 
TextFileDisplayer 对 象 的 doYourThing() 方 法 时 ， 它 将 试图 打开 并 读 取 这 文件 的 内 容 ， 并 把 
它们 打印 到 标准 输出 上 。 

方法 doYourThing() 的 另 一 个 例子 来 自 类 Friend 和 类 Stranger， 它 们 在 本 章 前 面 的 代码 
签名 的 示例 中 已 经 出 现 过 。 

在 Friend 和 Stranger 中 有 很 多 相同 的 地 方 ， 它 们 有 一 样 的 实例 变量 、 构 造 器 以 及 
doYourThing(0 方 法 ， 它 们 仅仅 是 所 在 的 包 以 及 名 称 不 同 。 当 创建 一 个 新 的 Friend 或 
Stranger 对 象 时 ， 必 须 向 构造 器 传递 一 个 布尔 值 和 到 另 一 个 对 象 的 引用 。 这 个 构造 器 将 传 
递 进来 的 Doer 引用 存放 在 实例 变量 next 中 ， 并 将 布尔 值 存 放 在 实例 变量 direct 中 。 当 一 
个 Friend 对 象 或 一 个 Stmager 对 象 的 doYourThing() 方 法 被 调用 时 ， 这 个 方法 直接 或 间接 地 
调用 next 中 包含 的 Doer 引用 的 doYourThing() 方 法 。 如 果 dirct 为 tue，Friend 或 Stranger 
仅仅 直接 调用 next 的 doYourThing() 方 法 ;否则 Friend 或 Stranger 的 doYourThing0) 通 过 一 
个 doPrivileged0 调 用， 间接 调用 next 的 doYourThing() 方 法 。 


ND 六 


长 久 以 来 ， 如 何 开发 网 络 软件 是 Java 开发 人 员 所 面临 的 最 大 挑战 之 一 。 
在 网 络 领域 需要 实现 平台 无 关 性 ， 因 为 同一 网 络 中 通常 连接 了 多 种 不 同 的 计算 
机 和 设备 。 除 此 之 外 ， 安 全 模式 也 是 一 个 挑战 ， 因 为 网 络 可 以 方便 地 传输 病毒 
和 其 他 形式 的 恶意 代码 。 本 章 将 详细 讲解 Java 如 何 把 握 网 络 所 带 来 的 巨大 机 
遇 ， 为 学 习 本 书后 面 的 知识 打下 基础 。 


i 此 相册 开 发: 
= 二 权衡 优 1 和 安全 的 最 优 


4.1 为 什么 需要 网 络 移动 性 


在 个 人 电脑 流行 之 前 ， 占 主要 地 位 的 计算 模式 是 服务 于 多 个 终端 用 户 的 大 型 计算 机 系 
统 。 大 型 主机 利用 分 时 技术 分 别 关 注 从 哑 终 端 登 录 到 主机 的 多 个 终端 用 户 。 软 件 应 用 程序 
存储 在 主机 的 磁盘 上 ， 使 用 户 不 仅 可 以 共享 一 个 CPU， 而 且 可 以 共享 同样 的 应 用 程序 。 这 
种 模式 有 个 缺点 ， 如 果 某 个 用 户 运行 的 作业 占用 了 大 量 CPU 资源 的 话 ， 其 他 用 户 的 性 能 
就 会 大 受 影 响 。 

微 处理 器 的 出 现 推动 了 个 人 计算 机 的 蓬勃 发 展 。 硬 件 的 这 种 变化 引起 了 软件 的 相应 变 
化 ， 各 用 户 不 再 共享 存储 在 主机 上 的 软件 应 用 程序 ， 而 是 在 各 自 的 PC 机 上 拥有 自己 的 软 
件 拷贝 。 每 个 用 户 在 自己 专用 的 CPU 上 运行 软件 ， 因 此 ， 这 种 计算 模式 解决 了 多 用 户 共 
享 同 一 主机 CPU 时 间 多 带 来 的 问题 。 

最 初 ， 个 人 计算 机 像 一 些 独立 的 孤岛 一 样 分 别 进行 计算 。 居 统治 地 位 的 软件 模式 是 在 
孤立 的 个 人 计算 机 上 运行 孤立 的 软件 。 但 是 很 快 ， 个 人 计算 机 开始 互联 成 网 。 因 为 个 人 计 
算 机 只 为 自己 的 用 户 服务 ， 它 解决 了 大 型 计算 机 系统 中 CPU 分 时 的 难题 。 但 除非 这 些 个 
人 计算 机 连接 成 网 络 ， 否 则 它们 就 不 能 像 大 型 计算 机 系统 那样 使 多 个 用 户 共享 集中 存储 的 
数据 了 。 

当 个 人 计算 机 互联 成 网 变 得 越 来 越 普遍 的 时 候 ， 另 一 种 软件 模式 日 益 重要 起 来 ， 即 
“客户 机 /服务 器 ”模式 。“ 客 户 机 /服务 器 ”模式 将 任务 分 为 两 部 分 ， 分 别 运行 在 两 种 计 
后 客户 端 进程 运行 在 终端 用 户 的 个 人 计算 机 上 ， 而 服务 器 端 进程 运行 在 同一 网 络 的 

台 计算 机 上 。 客 户 端 和 服务 器 端的 进程 通过 网 络 来 回 发 送 数据 进行 传输 。 服 务 器 端 进 
程 通常 只 是 简单 地 接受 网 络 中 客户 端 发 来 的 数据 请 求 命令 ， 从 中 央 数 据 库 中 提取 需要 的 数 
据 ， 并 将 该 数据 发 送 给 客户 端 。 而 客户 端 在 接 到 数据 后 ， 进 行 处 理 ， 然 后 显示 并 允许 用 户 
操纵 数据 。 这 样 的 模式 允许 个 人 计算 机 的 终端 用 户 读 取 并 操作 放 在 中 央 储 藏 库 的 数据 ， 而 
不 需 强迫 这 些 用 户 共享 中 央 CPU 来 处 理 数据 。 终 端 用 户 地 区 是 共享 了 运行 服务 器 端 进程 
的 CPU， 但 在 一 定 程度 上 ， 数 据 处 理 是 由 客户 端 完 成 的 ， 因 此 服务 器 端 CPU 的 负载 大 大 
减轻 了 。 

很 快 ，“ 客 户 机 /服务 器 ”模式 中 就 不 止 包括 两 个 处 理 器 了 。 最 初 它 被 称 做 两 层 客户 机 
/服务 器 模式 : 一 层 是 客户 端 ， 另 一 层 是 服务 器 。 更 复杂 一 些 的 模型 叫做 三 层 ( 表 示 有 三 个 
进程 )、 四 层 (四 个 进程 ) 或 者 N 层 结构 ， 也 就 是 说 层次 结构 越 来 越 多 了 。 当 更 多 的 进程 加 入 
计算 时 ， 客 户 端 和 服务 器 的 区 别 模糊 了 ， 于 是 人 们 开始 使 用 “分 布 式 处 理 ” 这 个 新 名 词 来 
涵盖 所 有 这 些 结构 模式 。 

分 布 式 处 理 模式 综合 了 网 络 和 处 理 器 发 展 的 优点 ， 将 进程 分 布 在 多 个 处 理 器 上 运行 ， 
并 人 允许 这 些 进程 共享 数据 。 尽 管 这 种 模式 有 许多 大 型 计算 机 系统 所 无 法 比拟 的 优势 ， 但 它 
也 有 个 不 可 忽视 的 缺点 : 分 布 式 处 理 比 大 型 计算 机 系统 更 难 管理 。 在 大 型 计算 机 系统 中 ， 
软件 应 用 程序 存储 在 主机 的 磁盘 上 ， 虽 然 可 以 有 多 个 用 户 使 用 该 软件 ， 但 它 只 需 在 一 个 地 
方 安装 和 维护 。 升 级 一 个 软件 后 ， 所 有 用 户 在 下 一 次 登录 并 启动 该 软件 的 时 候 可 以 得 到 这 
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个 新 的 版 本 。 但 是 相反 ， 在 分 布 式 系统 中 ， 不 同 组 件 的 软件 往往 存储 在 不 同 的 磁盘 上 ， 因 
此 ， 系 统管 理 员 需要 在 分 布 式 系统 的 不 同 组 件 上 安装 和 维护 软件 。 要 升级 一 个 软件 时 ， 管 
理 员 不 得 不 分 别 升级 每 台 计 算 机 上 的 这 个 软件 。 所 以 ， 分 布 式 处 理 的 系统 管理 比 大 型 计算 
机 系统 要 困难 得 多 。 

Java 的 体系 结构 使 软件 的 网 络 移动 性 成 为 可 能 ， 同 时 也 预示 了 一 种 新 的 计算 模式 的 到 
来 。 这 种 新 的 模式 建立 在 流行 的 分 布 式 处 理 模式 的 基础 上 ， 并 可 以 将 软件 通过 网 络 自动 传 
送 到 各 台 计 算 机 上 。 这 样 就 解决 了 分 布 式 处 理 系统 中 系统 管理 的 困难 。 例 如 在 一 个 C/S 系 
统 中 ， 客 户 端 软件 可 以 存储 在 网 络 中 的 一 台中 央 计算 机 上 ， 当 终端 用 户 需要 用 该 软件 的 时 
候 ， 这 个 中 央 计 算 机 会 通过 网 络 将 可 执行 的 软件 传送 到 终端 用 户 的 计算 机 上 运行 。 

因此 ， 软 件 的 网 络 移动 性 标志 着 计算 模式 发 展 历程 中 的 重要 一 步 ， 尤 其 是 它 解决 了 分 
布 式 处 理 系统 中 系统 管理 的 问题 ， 简 化 了 将 软件 分 布 在 多 台 CPU 上 的 工作 。 它 使 数据 可 
以 跟 相 关 软 件 一 起 传送 。 


4.2 网 络 对 软件 的 影响 


从 大 型 计算 机 模式 过 渡 到 分 布 式 处 理 模式 是 个 人 计算 机 革命 的 一 个 产物 。 而 个 人 计算 
机 革命 的 到 来 得 益 于 处 理 器 性 能 的 快速 增长 和 价格 的 降低 。 自 从 网 络 诞生 那 一 天 起 ， 就 形 
成 了 一 种 新 的 软件 模式 。 本 节 将 简要 介绍 这 种 模式 的 种 种 元 素 。 


4.2.1 什么 是 网 络 


网 络 原 指 用 一 个 巨大 的 虚拟 画面 ， 把 所 有 东西 连接 起 来 ， 也 可 以 作为 动词 使 用 。 在 计 
算 机 领域 中 ， 网 络 就 是 用 物理 链 路 将 各 个 孤立 的 工作 站 或 主机 相连 在 一 起 ， 组 成 数据 链 
路 ， 从 而 达到 资源 共享 和 通信 的 目的 。 凡 将 地 理 位 置 不 同 ， 并 具有 独立 功能 的 多 个 计算 机 
系统 通过 通信 设备 和 线路 而 连接 起 来 ， 且 以 功能 完善 的 网 络 软件 (网 络 协议 、 信 息 交 换 方 式 
及 网 络 操作 系统 等 ) 实 现 网 络 资源 共享 的 系统 ， 可 称 为 计算 机 网 络 。 

网 络 是 信息 传输 、 接 收 、 共 享 的 虚拟 平台 ， 通 过 它 把 各 个 点 、 面 、 体 的 信息 联系 到 一 
起 ， 从 而 实现 这 些 资源 的 共享 。 网 络 是 人 们 信息 交流 、 使 用 的 一 个 工具 。 作 为 工具 ， 它 一 
定 会 越 来 越 好 用 ， 功 能 也 会 越 来 越 多 。 内 容 也 会 越 来 越 丰富 。 网 络 会 借助 文字 阅读 、 图 片 
查看 、 影 音 播放 、 下 载 传输 、 游 戏 聊 天 等 软件 工具 从 文字 、 图 片 、 声 音 、 视 频 等 方面 给 人 
们 带 来 极其 丰富 和 美好 的 使 用 和 享受 。 网 络 也 是 交流 、 资 源 共享 的 通道 ， 但 它 毕 竟 是 人 类 
的 一 个 工具 ， 相 信 有 一 天 ， 网 络 会 借助 软件 工具 的 作用 带 给 人 们 极其 美好 甚至 超越 人 体 本 
身 所 能 带 来 的 感受 。 比 如 借助 软件 工具 让 人 以 极其 真实 的 外 貌 、 感 觉 进 入 网 络 平台 ， 从 生 
老病 死 、 游 戏 娱乐 、 结 婚 生子 等 。 但 这 些 只 是 丰富 了 人 们 的 生活 而 不 能 取代 人 们 的 生活 ， 
它 只 能 模仿 人 的 感受 而 不 能 取代 人 的 感受 。 网 上 可 以 直接 实现 虚拟 产品 的 交易 ， 如 文字 、 
影视 、 音 乐 的 购买 、 发 送 、 传 输 、 接 收 。 
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4.2.2 ”计算 机 网 络 的 发 展 历史 


随 着 1946 年 世界 上 第 一 台电 子 计 算 机 问世 后 的 十 多 年 时 间 内 ， 由 于 价格 很 昂贵 ， 电 
脑 数量 极 少 。 早 期 所 谓 的 计算 机 网 络 主要 是 为 了 解决 这 一 矛盾 而 产生 的 ， 其 形式 是 将 一 台 
计算 机 经 过 通信 线路 与 若干 台 终 端 直接 连接 ， 我 们 也 可 以 把 这 种 方式 看 作 最 简单 的 局 域 网 
雏形 。 

世界 上 最 早 的 网 络 是 由 美国 国防 部 高 级 研究 计划 局 (ARPA) 建 立 的 。 现 代 计算 机 网 络 的 
许多 概念 和 方法 ， 如 分 组 交换 技术 都 来 自 ARPAnet。ARPAnet 不 仅 进 行 了 租用 线 互联 的 分 
组 交换 技术 研究 ， 而 且 做 了 无 线 、 卫 星 网 的 分 组 交换 技术 研究 ， 其 结果 导致 了 TCP/IP 
问世 。 

1977 一 1979 年 ，ARPAnet 推出 了 目前 形式 的 TCP/IP 体系 结构 和 协议 。1980 年 前 后 ， 
ARPAnet 上 的 所 有 计算 机 开始 了 TCP/IP 协议 的 转换 工作 ， 并 以 ARPAnet 为 主干 网 建立 了 
初期 的 Internet。1983 年 ，ARPAnet 的 全 部 计算 机 完成 了 向 TCP/IP 的 转换 ， 并 在 
UNIX(BSD4.1) 上 实现 了 TCP/IP。ARPAnet 在 技术 上 最 大 的 贡献 就 是 TCP/IP 协议 的 开发 和 
应 用 。2 个 著名 的 科学 教育 网 CSNET 和 BITNET 先后 建立 。1984 年 ， 美 国 国家 科学 基金 
会 NSF 规划 建立 了 13 个 国家 超级 计算 中 心 及 国家 教育 科技 网 ， 随 后 替代 了 ARPANET 的 
骨干 地 位 。1988 年 Internet 开始 对 外 开放 。1991 年 6 月 ， 在 连通 Internet 的 计算 机 中 ， 商 
业 用 户 首次 超过 了 学 术 界 用 户 ， 这 是 Intemet 发 展 史 上 的 一 个 里 程 碑 ， 从 此 Internet 成 长 速 
度 一 发 不 可 收拾。 


4.2.3 网络 应 用 形成 了 一 种 新 的 软件 模式 


软件 模式 向 着 具有 网 络 移动 性 的 分 布 式 处 理 的 方向 发 展 ， 这 得 益 于 另 一 种 硬件 的 发 
展 ， 即 网 络 带宽 的 性 能 提高 和 价格 下 降 。 网 络 带宽 是 指 网 络 中 可 负载 的 信息 总 量 。 带 宽 的 
增长 使 传输 新 的 数据 成 为 可 能 ， 而 每 增加 一 种 传输 信息 ， 网 络 就 会 呈现 一 种 新 的 特性 。 这 
样 ， 随 着 带宽 的 增长 ， 网 络 上 传输 的 简单 文本 可 以 附带 上 图 片 ， 网 络 就 实现 了 报纸 和 杂志 
的 功能 。 一 旦 带宽 足以 负载 音频 数据 流 ， 网 络 就 能 够 承担 收音 机 、CD 播放 机 或 者 电话 的 
任务 。 带 宽 继 续 增 长 的 话 ， 传 输 视频 数据 就 成 为 可 能 ， 网 络 就 可 以 与 电视 机 、 录 像 机 匹敌 
了 。 除 此 之 外 ， 网 络 带宽 的 增长 还 促进 了 另 一 种 事务 的 发 展 ， 即 计算 机 软件 。 因 为 网 络 是 
由 互相 连接 的 处 理 器 组 成 的 ， 理 论 上 讲 ， 只 要 有 足够 的 带宽 ， 一 个 处 理 器 就 可 以 通过 网 络 
将 代码 发 送 到 另 一 个 处 理 器 上 执行 。 一 旦 软件 可 以 像 数 据 一 样 被 传输 ， 整 个 网 络 就 仿佛 一 
台 计 算 机 一 样 。 

一 旦 软件 可 以 通过 网 络 传输 ， 那 么 不 仅 网 络 ， 就 连 软件 本 身 ， 也 会 呈现 出 一 种 新 的 特 
征 。 具 有 网 络 移动 性 的 代码 很 容易 确保 终端 用 户 拥有 必 备 的 软件 来 浏览 和 操纵 网 络 传输 的 
数据 ， 因 为 软件 可 以 随 数据 一 起 传输 。 在 旧 的 模式 中 ， 用 户 启动 本 地 磁盘 上 的 可 执行 软件 
来 浏览 网 络 传输 过 来 的 数据 ， 所 以 软件 应 用 程序 通常 是 一 个 与 数据 完全 独立 的 实体 。 而 新 
的 模式 中 ， 由 于 软件 和 数据 都 是 由 网 络 传输 的 ， 软 件 和 数据 的 区 别 已 经 不 那么 明显 了 ， 软 
件 和 数据 被 统称 为 “内 容 ”。 

当 软 件 的 本 质 发 生 了 变化 时 ， 终 端 用 户 与 软件 的 关系 也 随 之 变化 。 在 有 网 络 移动 性 以 
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前 ， 终 端 用 户 不 得 不 考虑 软件 应 用 程序 的 版 本 问题 。 软 件 通常 是 通过 磁带 ， 软 件 或 者 光盘 
等 介质 来 发 布 的 。 如 果 想 使 用 某 个 应 用 程序 ， 终 端 用 户 必 须 先 得 到 这 种 安装 介质 ， 将 他 们 
插入 计算 机 附加 的 驱动 器 ， 运 行 安装 程序 ， 将 安装 介质 上 的 文件 拷贝 到 计算 机 硬盘 上 。 不 
仅 如 此 ， 用 户 经 常 需要 为 同一 个 应 用 程序 多 次 重复 该 安装 过 程 ， 因 为 软件 经 常会 有 新 旧版 
本 的 更 蔡 ( 新 版 本 解决 了 旧版 本 中 的 问题 ， 代 蔡 旧 版 本 ， 但 同时 也 会 带 来 新 的 麻烦 )。 当 新 
版 本 软件 发 布 时 ， 终 端 用 户 不 得 不 决定 是 否 要 升级 该 软件 。 如 果 要 升级 ， 就 要 重复 安装 过 
程 。 因 此 用 户 不 得 不 考虑 软件 的 版 本 问题 ， 并 花 大 量 精 力 来 更 新 软件 。 

在 新 的 软件 模式 下 ， 终 端 用 户 可 以 较 少 考虑 软件 的 版 本 问题 ， 而 享受 一 种 自动 更 新 的 
“内 容 服 务 ”。 尽 管 传统 软件 的 安装 和 升级 对 用 户 来 说 是 一 项 需要 慎重 考虑 的 工作 ， 但 软 
件 的 网 络 移动 性 可 以 使 软件 的 安装 和 升级 自动 完成 。 网 络 发 布 的 软件 不 需要 让 用 户 知道 断 
断 续 续 的 版 本 号 ， 用 户 也 不 必 决 定 是 否 升级 ， 不 必 亲 自动 手 去 升级 。 网 络 发 布 的 软件 能 够 
自动 保持 版 本 一 致 。 终 端 用 户 不 用 再 购买 版 本 众多 的 软件 应 用 程序 ， 而 只 需要 订购 一 个 通 
过 网 络 发 布 的 并 带 有 相关 数据 的 内 容 服 务 的 软件 ， 然 后 ， 这 个 软件 和 数据 就 可 以 自动 更 
新 了 。 

一 旦 抛弃 了 就 有 的 ， 有 多 个 版 本 的 软件 ， 而 采用 交互 的 内 容 自动 更 新 的 软件 发 布 方 
式 ， 终 端 用 户 就 会 丧失 一 些 控制 权力 。 在 旧 的 软件 模式 下 ， 如 果 软 件 的 新 版 本 出 现 了 严重 
的 bug， 终 端 用 户 只 要 不 升级 就 可 以 避免 问题 了 。 但 在 新 的 软件 模式 下 ， 因 为 用 户 可 能 没 
有 权利 控制 升级 过 程 ， 所 以 ， 有 可 能 在 发 现 新 版 本 的 问题 前 就 已 经 被 安装 了 新 版 软件 。 

对 于 某 些 软件 ， 尤 其 是 那些 庞大 的 、 功 能 齐全 的 软件 ， 终 端 用 户 更 希望 能 保留 权利 ， 
让 自己 决定 什么 时 候 ， 在 哪里 升级 。 因 此 ， 在 某 些 情况 下 ， 软 件 提 供 商会 通过 网 络 发 布 内 
容 服务 软件 的 不 同 版 本 。 至 少 ， 提 供 商会 发 布 一 个 服务 的 两 个 版 本 : 一 个 是 beta 版 本 ， 一 
个 是 正式 发 布 版 本 。 希 望 使 用 更 新 版 本 的 终端 用 户 可 以 订购 beta 版 本 的 服务 ， 其 他 用 户 可 
以 订购 正式 版 本 一 一 因为 尽管 正式 版 本 不 像 beta 版 本 那样 有 最 新 的 特性 ， 但 是 更 稳定 ， 健 
壮 性 更 好 。 

对 于 某 些 内 容 服务 ， 尤 其 是 简单 的 软件 ， 大 多 数 终端 用 户 不 想 因 过 多 地 考虑 版 本 问题 
而 增加 软件 的 使 用 难度 。 终 端 用 户 不 得 不 了 解 不 容 版 本 间 的 差别 ， 并 决定 什么 时 候 、 是 否 
要 费劲 地 去 升级 这 个 软件 。 而 没有 分 散 成 多 个 版 本 的 额 内 容 服务 相 比 之 下 就 容易 使 用 多 
了 ， 因 为 它们 可 以 自动 升级 。 因 为 用 户 无 需 维护 ， 而 只 要 简单 实用 即 可 ， 所 以 这 样 的 内 容 
服务 看 上 去 就 像 一 个 盛 软件 的 器 四 。 

许多 自动 更 新 的 内 容 服务 与 普通 的 家 居 器 血 有 两 个 相似 的 重要 特征 : 有 一 个 主要 的 功 
能 和 一 个 简单 的 用 户 接口 。 比 如 说 烤箱 ， 烤 箱 的 主要 功能 就 是 准备 烘 烤 食物 ， 而 且 有 一 个 
简单 的 用 户 接口 一 一 你 想 使 用 烤箱 时 ， 并 不 想 去 读 复杂 的 说 明 书 吧 ? 你 希望 简单 地 把 面包 
放 进去 ， 关 上 烤箱 ， 看 着 里 面 亮 起 橘 黄色 的 微 光 ， 片 刻 后 ， 你 的 面包 就 烤 好 了 。 如 果 不 小 
心 烤 得 太 焦 或 者 不 够 ， 你 就 希望 能 有 一 个 旋钮 ， 以 便 下 次 烤 面包 时 做 相应 的 调整 。 这 就 是 
烤箱 的 功能 和 接口 。 与 之 相似 ， 许 多 内 容 服务 的 功能 也 很 单一 ， 用 户 接口 简单 易 用 。 比 如 
想 在 网 络 上 订购 一 部 电影 ， 你 肯定 不 想 费 心 去 考虑 是 否 有 合适 的 电影 订购 软件 版 本 ， 也 不 
愿意 去 安装 这 种 软件 。 你 只 想 打开 订购 电影 的 内 容 服务 ， 通 过 简单 的 用 户 接口 来 订购 你 的 
电影 。 然 后 ， 就 可 以 坐 下 来 欣赏 网 上 传输 过 来 的 电影 和 享用 烤 面 包 了 。 
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内 容 服务 的 一 个 绝 好 例子 就 是 万 维 网 网 页 。 当 你 看 一 个 HTML 文件 时 ， 可 以 将 它 看 作 
某 种 程序 的 源 文件 ;但 是 如 果 你 把 浏览 器 看 作 应 用 程序 的 话 ， 那 HTML 文件 就 可 以 看 作 数 
据 了 。 因 此 ， 源 代码 与 数据 间 的 区 别 不 很 清晰 。 同 样 ， 人 们 浏览 万 维 网 时 ， 希 望 网 页 能 自 
动 地 不 断 更 新 。 人 们 不 希望 看 到 网 页 的 多 个 版 本 ， 不 希望 费 很 大 力气 手工 地 升级 到 网 页 的 
最 新 版 本 。 

今后 ， 现 在 的 许多 媒体 都 将 在 某 种 程度 上 融入 网 络 ， 转 型 到 内 容 服 务 上 去 。 收 音 机 、 
电视 机 、 电 话 、 应 答 机 、 传 真 机 、 录 像 带 出 租 店 、 报 纸 、 杂 志 、 书 籍 ， 甚 至 计算 机 软 
件 …… 这 一 切 都 会 受到 网 络 发 展 的 影响 。 正 如 电视 机 不 能 完全 取代 收音 机 一 样 ， 网 络 传输 
的 内 容 服 务 也 不 可 能 完全 葵 代 现 有 的 媒体 。 但 内 容 服 务 有 可 能 取代 现 有 媒体 某 些 方面 的 功 
能 ， 使 其 作出 相应 的 调整 ， 并 创造 出 一 些 新 的 媒体 形式 。 

在 计算 机 领域 ， 内 容 服务 模式 也 不 能 完全 取代 旧 的 软件 模式 。 它 只 能 替代 旧 模式 的 某 
些 方面 (它们 更 适合 新 的 软件 模式 )， 增 加 一 些 新 的 形式 ， 促 使 昌 的 软件 模式 进行 调整 。 


4.3 ”Java 体系 对 网 络 的 支持 


Java 体系 结构 对 网 络 移动 性 的 支持 是 和 它 对 平台 无 关 性 和 安全 性 的 支持 密 不 可 分 的 。 
虽然 平台 无 关 性 和 安全 性 对 网 络 移动 性 而 言 并 非 是 必需 的 ， 但 它们 对 网 络 移动 性 的 实际 应 
用 有 很 大 帮助 。 在 本 节 的 内 容 中 ， 将 简要 讲解 Java 体系 对 网 络 的 支持 的 知识 。 


4.3.1 对 网 络 安全 的 支持 


21 世纪 随 着 人 们 的 生活 和 工作 越 来 越 网 络 化 ， 网 络 安全 已 渐渐 成 为 人 们 关心 的 一 个 重 
要 问题 。 要 保证 信息 在 网 络 环境 下 是 安全 的 ， 就 必须 对 信息 进行 加 密 、 签 名 、 验 证 等 一 系 
列 的 操作 。 而 Java 语言 能 够 对 网 络 安全 通信 进行 很 好 的 支持 。 

随 着 计算 机 技术 的 飞速 发 展 ， 信 息 网 络 已 经 成 为 社会 发 展 的 重要 保证 。 信 息 网 络 涉及 
国家 的 政府 、 军 事 、 文 教 等 诸多 领域 。 其 中 存储 、 传 输 和 处 理 的 信息 有 许多 是 政府 宏观 调 
控 决 策 、 商 业经 济 信 息 、 银 行 资金 转账 、 股 票证 券 、 能 源 资源 数据 、 科 研 数据 等 重要 信 
息 。 还 有 很 多 是 敏感 信息 ， 甚 至 是 国家 机 密 。 所 以 难免 会 吸引 来 自 世 界 各 地 的 各 种 人 为 攻 
击 (例如 信息 泄漏 、 信 息 窃 取 、 数 据 算 改 、 数 据 删 添 、 计 算 机 病毒 等 )。 

为 了 保证 网 络 中 的 信息 是 安全 的 ， 必 须 采 用 一 些 加 密 、 数 字 签名 、 身 份 认证 等 安全 策 
略 来 有 效 地 防范 网 络 安全 。Java 语言 在 网 络 安全 方面 提供 了 很 强大 的 技术 支持 ， 从 而 能 够 
很 有 效 地 保护 信息 在 网 络 中 的 保密 性 、 完 整 性 和 可 用 性 。 

1. Java 语言 安全 性 的 系统 结构 

对 于 Java JDK 来 说 ， 无 论 代 码 在 本 地 还 是 在 远 端 运行 ， 都 要 对 应 一 个 安全 策略 
(Security Policy) 。 安 全 策略 定义 了 不 同 签名 者 、 不 同 来 源 的 一 套 权 限 控制 策略 
(Permissions)， 在 权限 控制 中 说 明了 对 资源 (如 文件 、 目 录 、 网 络 端口 等 ) 的 访问 权限 ， 如 
图 4-1 所 示 。 
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4-1 Java 的 安全 模型 


运行 系统 将 代码 组 织 到 单独 的 域 (Domains) 中 ， 每 个 域 封装 一 组 具有 相同 控制 权限 的 类 
的 实例 。 域 相当 于 沙 箱 (SandBox)，Java 小 应 用 程序 Applet 只 能 在 管理 员 的 授权 下 运行 于 
一 个 受 限 制 的 环境 中 。 而 应 用 程序 则 不 用 受 这 些 限 制 ， 但 必须 在 安全 策略 的 授权 下 运行 。 


2. 密码 使 用 的 体系 结构 


从 JDK 6 版 本 开始 ， 不 但 保留 了 以 前 的 签名 算法 、 消 息 摘要 算法 、 密 钥 生 成 算法 ， 还 
增加 了 密 钥 管理 、 算 法 参数 生成 、 算 法 参数 管理 、 随 机 数 生成 算法 ， 支 持 不 同 密 钥 转 化 的 
代理 和 认证 中 心 等 安全 性 算法 。JDK 中 还 增加 了 一 个 加 密 算法 的 扩展 包 (Java Cryptography 
Extension 即 JCE)， 其 模型 如 图 4-2 所 示 。 它 提供 了 全 面 的 平台 无 关 的 安全 应 用 API 函数 ， 
实现 了 密 钥 管理 、 数 字 签名 、MD5、SHA-1、 基 于 X.509 的 认证 代理 等 网 络 安全 的 常用 功能 。 
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4-2 Java 加 密 算法 扩展 包 (JCE) 模 型 
3. 使 用 Java 安全 工具 进行 安全 通信 
1) Java 安全 工具 简介 
使 用 Java 安全 工具 可 以 用 来 设置 安全 策略 并 在 远程 站 点 上 创建 工作 在 安全 策略 范围 内 
的 应 用 程序 。 其 常用 的 安全 工具 有 如 下 几 种 。 
(1) 密 钥 和 证 书 管理 工具 (keytool) 
keytool 工具 主要 是 负责 公私 钥 对 的 生成 、 向 CA 认证 中 心 发 送 证 书 申请 、 接 受 CA 的 回 
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复 并 记录 信任 的 公 钥 与 实体 的 对 应 表 ， 维 护 密 钥 库 (keystore)。 使 用 此 命令 的 基本 形式 是 : 


keytool command options 


keytool 工具 主要 有 如 下 几 种 命令 : 

口 certreq: 产生 一 个 证 书签 名 请 求 (Generate a Certificate Signing Request, CSR) 给 
CA， 由 CA 来 认证 自己 的 证 书 。 

口 ”delete: 删除 对 应 的 密 钥 库 的 记录 。 

口 “export: 将 公 钥 证 书 输出 到 某 个 文件 。 

口 “genkey: 在 密 钥 库 中 存 入 私 钥 与 公 钥 对 ， 后 者 保存 在 一 个 自己 签名 的 证 书 中 。 

口 “ import: 将 一 个 信任 的 证 书 导 入 ， 或 者 是 接 到 了 CA 的 回复 ， 将 该 证 书 取代 原来 
密 钥 库 中 自己 签名 的 证 书 。 

口 ”keypasswd: 为 某 私 钥 分 配 密码 。 

口 list， 列 出 密 钥 库 中 所 有 入 口 。 

口 storepasswd: 给 密 钥 库 分 配 密码 。 

(2) Java 文档 处 理工 具 (jar) 

如 果 要 对 代码 签名 ， 需 要 先 用 jar 将 其 打包 ， 然 后 用 jarsigner 来 签名 ， 使 用 命令 的 基 

本 格式 是 : 


jar cf jar-file input-file(s) 

(3) Java 文档 签名 及 验证 工具 (jarsigner) 

jarsigner 工具 通过 密 钥 库 中 的 数据 来 对 jar 文件 进行 签名 和 认证 。 

(4) 策略 编辑 器 (policytooD) 

用 于 编辑 系统 的 策略 文件 policy。 

2) 发 送 者 签名 并 发 送 代码 文件 

发 送 方 可 对 自己 的 Java 代码 进行 签名 后 发 送 ， 以 保证 程序 的 安全 性 ， 其 过 程 如 图 4-3 
所 示 。 
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首先 发 送 者 可 以 将 Java 源 程 序 编译 为 class 文件 ， 再 将 其 压缩 为 jar 文件 ， 而 后 对 压缩 
的 jar 代码 文件 进行 数字 签名 。 签 名 时 使 用 keytool 工具 分 别 产 生 一 对 公私 钥 对 ， 发 送 者 使 
用 私 钥 对 jar 代码 文件 进行 签名 ， 接 受 者 就 可 以 使 用 公开 的 公 钥 对 签名 过 的 jar 文件 进行 
验证 。 

发 送 者 代码 签名 的 具体 过 程 如 下 : 

(1) [生成 私 钥 ] keytool -genkey -alias signFiles -keypass 123456 -keystore store - 
storepass 123456 

(2) [打包 ]jar cvf algrim.jar *.class 

(3) [签名 ] jarsigner -keystore store -signedjar sAlgrim.jar Algrim.jar signFiles 

(4) [成 证 书 ] keytool -export -keystore store -alias signFiles -file cer.cer 

3) 接收 者 接受 并 验证 代码 文件 

接收 者 在 收 到 发 送 者 签名 的 代码 文件 后 可 对 其 进行 检验 ， 以 检查 代码 文件 的 机 密 性 和 
完整 性 ， 其 过 程 如 图 4-4 所 示 。 
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4-4 接收 者 检验 代码 文件 


接收 者 在 检验 是 使 用 签名 者 的 公 钥 证 书 对 签名 后 的 代码 文件 进行 验证 。 

4) 接收 者 安全 运行 代码 文件 

接收 方 在 收 到 发 送 方 签名 的 代码 后 直接 运行 其 代码 是 不 允许 的 ， 只 有 先 将 证 书 引 入 本 
地 的 keystore 中 ， 作 为 信任 的 证 书 插入 ， 通 过 使 用 Policy Tool 来 配置 相应 的 策略 文件 ， 才 
能 够 有 效 地 运行 发 送 的 程序 代码 ， 其 过 程 如 图 4-5 所 示 。 

运行 时 可 使 用 以 下 两 种 配置 方式 。 

(1) 使 用 如 下 形式 : 

java -Djava.security.manager -Djava.security.policy= raypolicy -cp 

sCount.jar AppName 

(2) 通过 配置 浏览 器 使 用 的 java.home\lib\securityyjava.security 文件 可 以 通过 安全 检查 
后 运行 该 程序 。 
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to read the data file 


sCount .jar from Susan 
Sor Susan | | 
security manager 


4-5 ”接收 者 运行 代码 文件 
4. 构造 自己 的 安全 应 用 程序 


1) 基础 安全 API 
在 Java JDK 中 的 类 库 中 已 提供 了 大 量 的 类 和 接口 来 支持 安全 性 程序 的 开发 。 通 过 这 些 
类 可 方便 构建 自己 的 安全 应 用 程序 。 
在 Java 包 中 的 对 安全 性 支持 的 接口 ( Interface ) 有 : 
java.security.Certificate: 指定 类 型 的 证 书 。 
java.security.Key: 让 书 的 密 钥 。 
java.security.Principal: 可 以 提供 identify 的 任何 实体 。 
java.security.PrivateKey: 提供 私有 密 钥 。 
java.security.PublicKey: 提供 公有 密 钥 。 
java.security.acl 中 还 提供 了 如 下 支持 访问 控制 的 接口 。 
java.security.acl.Acl: 多 个 acl 的 入 口 的 集合 。 
java.security.acl.AclEntry: acl 的 入 口 。 
java.security.acl.Group: 一 组 Principal。 
java.security.acl.Owner: acl 的 管理 者 。 
java.security.acl.Permission: 控制 信息 。 
2) 构造 安全 应 用 程序 的 一 般 过 程 
使 用 Java JDK 来 构造 安全 应 用 程序 的 一 般 过 程 如 下 。 
(1) 产生 公 钥 和 私 钥 对 
[得 到 密 钥 产生 器 ] KeyPairGenerator keyGen = KeyPairGenerator.getInstance("DSA", 
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"SUN"): 

[初始 化 密 钥 产生 器 ] SecureRandom random = SecureRandom .getInstance("SHA1PRNG", 
"SUN"): keyGen.initialize(1024, randomy): 

[产生 公 铀 和 密 钥 ] KeyPair pair = keyGen.generateKeyPair();PrivateKey priv = 
pair.getPrivate(0: PublicKey pub = pair.getPublic(): 

(2) 对 数据 进行 签名 

[得 到 一 个 签名 对 象 ] Signature dsa = Signature.getInstance("SHA1withDSA", "SUN"); 

[初始 化 签名 对 象 ] dsa.initSign(priv); 

[对 数据 签名 ] dsa.update(buffer, 0, len); 

[得 到 签名 的 数据 ] byte[] realSig = dsa.sign(): 

(3) 存储 签名 和 公 钥 

签名 结果 直接 按 字 节 流 存储 ; 公 钥 通过 pub.getEncoded()， 先 转换 为 字 节 流 来 处 理 。 

(4) 从 文件 中 取得 公 钥 

[从 文件 中 读 到 字 节 流 中 ] encKey 

[构造 一 个 密 钥 说 明 类 ] X509EncodedKeySpec pubKeySpec = new 
X509EncodedKeySpec(encKey); 

[构造 一 个 密 钥 管理 器 ] KeyFactory keyFactory = KeyFactory.getInstance("DSA", 
"SUN"): 

[取得 公 钥 ] PublicKey pubKey = keyFactory.generatePublic(pubKeySpec):; 

(5) 验证 签名 

[ 同 生成 签名 一 样 先 取得 签名 对 象 ] Signature sig = Signature.getInstance("SHA1withDSA", 
"SUN"); 

[用 公 钥 初始 化 签名 对 象 ] sig.initVerify(pubKey); 

[取得 被 签名 的 数据 ] sig update(buffer, 0. len): 

[验证 ] boolean verifies = sig.verify(sigToVerify): 


4.3.2 ”网 络 移动 性 


平台 无 关 性 使 得 在 网 络 上 传送 程序 更 加 容易 ， 因 为 不 需要 为 每 个 不 同 的 主机 平台 都 准 
备 一 个 单独 的 版 本 ， 因 此 也 不 需要 判断 每 台 计 算 机 需要 哪个 特定 的 版 本 ， 一 个 版 本 就 可 以 
对 付 所 有 的 计算 机 。Java 的 安全 特性 促进 了 网 络 移动 性 的 推广 ， 因 为 最 终 用 户 就 算 从 不 信 
任 的 来 源 下 载 class 文件 ， 也 可 以 充满 自信 。 因 此 实际 上 ，Java 体系 结构 通过 对 平台 无 关 
性 和 安全 性 的 支持 ， 更 好 地 推广 了 它 的 class 文件 的 网 络 机 动 性 。 

除了 平台 无 关 性 和 安全 性 之 外 ，Java 体系 结构 对 网 络 移动 性 的 支持 主要 集中 在 对 在 网 
络 上 传送 程序 的 时 间 进 行 管理 上 。 假 若 你 在 服务 器 上 保存 了 一 个 程序 ， 在 需要 的 时 候 通 过 
网 络 来 下 载 它 ， 这 个 过 程 一 般 都 会 比 从 本 地 执行 该 程序 要 慢 。 因 此 对 于 在 网 络 上 传送 程序 
来 说 ， 网 络 移动 性 的 一 个 主要 难题 就 是 时 间 。Java 体系 结构 通过 把 传统 的 单一 二 进 制 可 执 
行文 件 切割 成 小 的 二 进 制 碎片 一 一 Java class 文件 一 一 来 解决 这 个 问题 。class 文件 可 以 独立 
在 网 络 上 传播 ， 因 为 Java 程序 是 动态 链接 、 动 态 扩展 的 ， 最 终 用 户 不 需要 等 待 所 有 的 程序 
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class 文件 都 下 载 完 毕 ， 就 可 以 开始 运行 程序 了 。 第 一 个 class 文件 到 手 ， 程 序 就 开始 执 
行 。class 文件 本 身 也 被 设计 得 很 紧凑 ， 所 以 它们 可 以 在 网 络 上 飞快 地 传送 。 因 此 Java 体 
系 结构 为 网 络 移动 性 带 来 的 直接 主要 好 处 就 是 把 一 个 单一 的 大 二 进 制 文件 分 割 成 小 的 class 
文件 ， 这 些 class 文件 可 以 按 需 装载 。 

Java 应 用 程序 从 某 个 类 的 main() 方 法 开始 执行 ， 其 他 的 类 在 程序 需要 的 时 候 才 动态 链 
接 。 如 果 某 个 类 在 一 次 操作 中 没有 被 用 到 ， 这 个 类 就 不 会 被 装载 。 比 如 说 ， 假 若 你 在 使 用 
一 个 字 处 理 程序 ， 它 有 一 个 拼写 检查 器 ， 但 是 在 你 使 用 的 这 次 操作 中 没有 使 用 拼写 检查 
器 ， 那 么 它 就 不 会 被 装载 。 

除了 动态 链接 之 外 ，Java 体系 结构 也 允许 动态 扩展 。 动 态 扩展 是 装载 class 文件 的 另 
一 种 方式 ， 可 以 延迟 到 Java 应 用 程序 运行 时 才 装 载 。 使 用 用 户 自 定义 的 类 装载 器 ， 或 者 
class 类 的 forName() 方 法 ，Java 程序 可 以 在 运行 时 装载 额外 的 程序 ， 这 些 程序 就 会 变 成 运 
行程 序 的 一 部 分 。 因 此 ， 动 态 链接 和 动态 扩展 给 了 Java 程序 员 一 些 设计 上 的 灵活 性 ， 既 可 
以 决定 何 时 装载 程序 的 class 文件 一 一 而 这 又 决定 了 最 终 用 户 需 要 等 待 多 长 时 间 来 从 网 络 
上 装载 class 文件 。 

除了 动态 链接 和 动态 扩展 ，Java 体系 结构 对 网 络 移动 性 的 直接 支持 还 通过 class 文件 
格式 体现 。 为 了 减少 在 网 络 上 传送 程序 的 时 间 ，class 文件 被 设计 得 很 紧凑 。 它 们 包含 的 字 
节 码 流 设计 得 特别 紧凑 一 一 之 所 以 被 称 为 “ 字 节 码 ”， 是 因为 每 条 指令 都 只 占据 一 个 字 
节 。 除 了 两 个 例外 情况 ， 所 有 的 操作 码 和 它们 的 操作 数 都 是 按照 字 节 对 齐 的 ， 这 使 得 字 节 
码 流 更 小 。 这 两 个 例外 是 这 样 一 些 操作 码 ， 在 操作 码 和 他 们 的 操作 数 之 间 会 填 上 1 一 3 个 
字 节 ， 并 且 在 操作 数 时 都 按照 字 边界 对 齐 。 

class 文件 的 紧凑 型 隐 含 着 另外 一 个 含义 ， 那 就 是 Java 编译 器 不 会 做 太 多 的 局 部 优 
化 。 因 为 二 进 制 兼容 性 规则 的 存在 ，Java 编译 器 不 能 做 一 些 全 局 优化 ， 比 如 把 一 个 方法 调 
用 转化 为 整个 方法 的 内 媒 ( 内 媒 指 把 被 调用 方法 的 整个 方法 体 都 蔡 换 到 发 起 调用 的 方法 中 
去 ， 这 样 在 代码 运行 的 时 候 ， 可 以 节省 方法 调用 和 返回 的 时 间 )。 二 进 制 兼容 性 要 求 : 假若 
一 个 方法 被 现 有 的 class 文件 依赖 ， 那 么 改变 这 个 方法 的 时 候 必须 不 破坏 已 有 的 调用 方 
法 。 在 同一 个 类 中 使 用 的 方法 可 能 使 用 内 典 ， 但 是 一 般 来 说 Java 编译 器 不 会 做 这 种 优化 ， 
部 分 原因 是 因为 ， 这 样 为 class 文件 瘦身 得 不 偿 失 。 优 化 常常 是 在 代码 大 小 和 执行 速度 间 
进行 的 折 中 。 因 此 ，Java 编译 器 通常 会 把 优化 工作 留 给 Java 虚拟 机 ， 后 者 在 装载 类 之 后 ， 
再 解释 执行 ， 即 时 编译 或 者 自 适 应 编译 的 时 候 都 可 以 优化 代码 。 

除了 动态 链接 、 动 态 扩 展 和 紧凑 的 class 文件 之 外 ， 还 有 一 些 并 非 体系 结构 必须 的 策 
略 ， 可 以 帮助 控制 在 网 络 上 传送 class 文件 的 时 间 。 因 为 HITP 需要 单独 为 Java Applet 中 
用 到 的 每 一 个 class 文件 单独 请 求 连接 ， 那 么 我 们 会 发 现下 载 applet 的 很 大 一 部 分 时 间 并 
不 是 用 来 实际 传输 class 文件 的 时 间 ， 而 是 每 一 个 class 文件 请 求 网 络 协议 握手 的 时 间 。 一 
个 文件 需要 的 总 时 间 是 按照 需要 下 载 的 class 文件 的 数目 倍增 的 。 为 了 解决 这 个 问题 ， 
Java 1.1 包含 了 对 Jar 的 支持 ，Jar 文件 允许 在 一 次 网 络 传输 过 程 中 传输 多 个 文件 ， 这 和 一 
次 次 传送 一 个 个 单独 的 class 文件 相 比 ， 大 幅度 降低 了 需要 的 总 体 下 载 时 间 。 更 大 的 优点 是 : 
Jar 文件 中 的 数据 可 以 压缩 ， 从 而 使 下 载 时 间 更 少 。 正 是 因为 这 个 原因 ， 所 以 有 时 候 通过 一 
个 大 文件 来 传送 软件 。 例 如 有 些 class 文件 是 程序 开始 运行 之 前 所 必需 的 ， 这 些 文件 可 以 
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很 快 地 通过 Jar 文件 一 次 性 传递 。 

另外 一 个 降低 最 终 用 户 等 待 时 间 的 策略 就 是 不 采取 按 需 下 载 class 文件 的 做 法 。 有 几 
种 不 同 的 技术 ， 例 如 MarimbaCastanet 使 用 的 订阅 模式 ， 可 以 在 需要 class 文件 之 前 就 把 它 
们 下 载 下 来 ， 这 样 程序 就 可 以 更 快 地 启动 。 

因此 ， 除 了 平台 无 关 性 和 安全 性 能 够 对 网 络 移动 性 有 利 外 ，Java 体系 结构 的 主要 着 眼 
点 就 是 控制 class 文件 在 网 络 上 传送 的 时 间 。 动 态 链接 和 动态 扩展 允许 Java 程序 按照 小 功 
能 单元 设计 ， 在 最 终 用 户 需 要 的 时 候 才 单 独 下 载 。class 文件 的 紧凑 性 本 身 有 助 于 减少 Java 
程序 在 网 络 上 传送 的 时 间 。Jar 文件 允许 在 一 次 网 络 连接 中 传送 多 个 文件 ， 还 允许 数据 
压缩 。 


4.4 applet 演示 


Java 是 一 种 网 络 化 的 技术 ， 在 网 络 被 逐渐 证 明成 为 下 一 次 计算 革命 的 时 代 出 现 。 然 而 
Java 被 如 此 迅速 而 广泛 使 用 的 原因 ， 并 不 在 于 它 是 一 种 适时 的 技术 ， 而 是 因为 它 有 合适 的 
市 场 。Java 并 非 是 20 世纪 90 年 代 中 期 开始 发 展 的 唯一 一 种 基于 网 络 的 语言 。 虽 然 他 是 一 
个 好 技术 ， 它 并 非 一 定 是 最 好 的 一 一 但 是 它 可 能 是 最 有 市 场 的 。Java 在 1995 年 初 打开 了 
一 小 块 市 场 ， 结 果 获 得 了 很 强烈 的 回应 ， 使 得 很 多 开发 类 似 技术 的 公司 被 迫 取 消 了 他 们 的 
项 目 。 拥 有 类 似 技术 的 公司 ， 比 如 AT&T， 他 们 拥有 一 个 网 络 化 的 技术 Inferno， 不 得 不 面 
对 Java 窃取 了 它们 本 可 能 获得 的 掌声 这 样 一 个 事实 。 

Java 从 最 初 产生 到 获得 巨大 的 市 场 成 功 ， 有 几 个 很 重要 的 事实 。 首 先 ， 他 有 一 个 很 酷 
的 名 字 一 一 除了 程序 员 之 外 ， 非 程序 员 也 能 赏识 它 。 其 次 ， 它 在 所 有 的 应 用 中 都 是 免费 的 
一 一 对 潜在 的 客户 来 说 这 是 一 个 魔 咒 。 但 是 Java 获得 市 场 成 功 最 重要 的 一 点 就 是 ，Sun 的 
工程 师 适时 把 Java 技术 和 WWW 融合 了 起 来 ， 那 恰恰 是 Netscape 试图 把 他 们 的 网 络 浏览 
器 从 一 个 图 形 化 的 超 文本 查看 器 变 成 一 个 全 功能 计算 平台 的 时 候 。 随 着 WWW 如 同 不 断 增 
高 的 巨 潮 席卷 整个 软件 产业 (也 是 一 次 全 球 思 潮 )，Java 就 站 在 了 浪 尖 上 。 因 此 ，Java 的 成 
功 可 以 说 是 因为 Java 会 “在 网 上 冲浪 ”， 它 在 正确 的 时 间 抓 住 了 浪潮 ， 并 且 一 次 次 稳 稳 地 
站 在 浪 尖 上 ， 它 潜在 的 竞争 者 都 被 无 声 地 吞没 了 。Sun 的 工程 师 把 Java 技术 和 WWW 融合 
起 来 的 方法 ， 这 就 是 Java 市 场 成 功 的 关键 所 在 ， 也 就 是 创造 了 一 种 Java 程序 的 特殊 形 
式 ， 可 以 在 Web 浏览 器 内 部 运行 Java Applet(Java 小 应 用 程序 )。 

Java Applet 展示 了 Java 基于 网 络 的 所 有 特性 : 平台 无 关 性 、 网 络 移动 性 和 安全 性 。 平 
台 无 关 性 对 于 WWW 来 说 是 一 个 主要 原则 ，Java Applet 正好 符合 。 在 任何 平台 上 ， 只 要 有 
支持 Java 的 浏览 器 ，Java Applet 就 可 以 运行 。Java Applet 也 展示 了 Java 在 安全 上 的 能 
力 ， 因 为 它们 是 在 一 个 严格 受 限 的 沙 箱 中 运行 的 。 但 是 最 重要 的 ，Java Applet 展示 了 它 承 
诺 的 网 络 移动 性 。 如 图 4-1 所 示 ，Java Applet 可 以 在 一 个 中 心服 务 器 上 维护 ， 可 以 通过 网 
络 传送 到 很 多 不 同 种 类 的 计算 机 中 。 要 升级 一 个 applet， 只 需要 升级 服务 器 上 的 即 可 。 用 
户 下 一 次 使 用 applet 的 时 候 ， 就 可 以 得 到 升级 过 后 的 版 本 。 因 此 ， 维 护 是 本 地 的 ， 运 行 却 
是 分 布 式 的 。 
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支持 Java 的 浏览 器 取代 了 使 用 Java 程序 来 包容 浏览 器 显示 类 applet 的 方法 。 要 显示 
一 个 网 页 ，Web 浏览 器 从 HTTP 服务 器 请 求 一 个 HIML 文件 。 加 入 的 HTML 文件 中 包含 
一 个 applet， 浏 览 器 会 看 到 下 面 的 HTML 标记 : 

<applet CODE="HeapOfFish.class" 

CODEBASE="gcsupport/classes" 

WIDTH="525" 

HEIGHT=360> 

</applet> 

上 面 的 “applet” 标 记 会 给 浏览 器 足够 的 信息 来 显示 这 个 applet。CODE 属性 标示 了 
applet 初始 class 文件 的 名 字 ， 这 里 是 HeapOfFish.class。CODEBASE 属性 指明 了 class 文 
件 相对 于 这 个 网 页 的 URL 路 径 ，WIDTH 和 HEIGHT 属性 表明 了 applet 屏幕 的 像素 宽度 和 
高 度 ， 也 就 是 网 页 上 applet 会 显示 出 来 的 区 域 。 

当 浏览 器 遇 到 一 个 包含 applet 标记 的 网 页 时 ， 它 把 信息 从 标记 送 到 一 个 运行 中 的 Java 
程序 。Java 程序 创建 一 个 新 的 用 户 自 定义 的 类 装载 器 对 象 (或 者 重用 已 有 的 那个 )， 来 装载 
这 个 applet 的 出 事 class 文件 。 然 后 它 首先 调用 applet 的 初始 类 的 init0 方 法 ， 再 调用 start() 
方法 ， 这 样 就 初始 化 了 applet。applet 需要 的 其 他 class 文件 按照 按 需 下 载 的 原则 在 动态 连 
接 的 处 理 过 程 中 下 载 。 比 如 说 ， 当 一 个 applet 的 初始 类 第 一 次 用 到 某 个 新 类 的 时 候 ， 必 须 
解析 新 类 的 符号 引用 ， 在 解析 过 程 中 ， 如 果 类 早已 被 装载 ，Java 虚拟 机 会 要 求 装载 同一 个 
用 户 自 定义 的 类 装载 器 (该 装载 器 装载 该 applet 的 初始 类 以 装载 新 类 )。 如 果 用 户 自 定义 的 
类 装载 器 不 能 本 地 装载 类 ， 它 就 会 尝试 从 网 络 上 下 载 这 个 class 文件 。 装 载 器 将 试图 从 它 
获得 applet 的 初始 类 相同 的 位 置 下 载 。 一 旦 applet 的 初始 化 完成 了 ，applet 就 如 同 网 页 的 
一 部 分 一 样 在 浏览 器 中 显示 出 来 。 


4.5 JINI 服务 对 象 


JINI( 是 Java Itelligent Network Infrastructure 的 缩写 ) 是 Sun 公司 的 研究 与 开发 项 目 ， 
它 能 极 大 地 扩展 Java 技术 的 能 力 。JINI 技术 可 使 范围 广泛 的 多 种 硬件 和 软件 ， 即 可 以 与 网 
络 相连 的 任何 实体 ， 能 够 自主 联网 。 本 节 将 简要 讲解 JINI 的 基本 知识 。 


4.5.1 Java 推出 JINI 的 背景 


虽然 Java 体系 结构 使 代码 的 网 络 移动 性 成 为 可 能 ， 并 由 代表 了 计算 模型 的 一 次 重要 革 
命 的 Javaapplet 表现 出 来 ， 但 Java 结构 还 有 另外 一 个 承诺 : 对 象 的 网 络 移动 性 。 对 象 在 网 
络 中 穿梭 ， 携 带 者 定义 自己 的 类 ， 加 上 表示 对 象 状态 的 快照 数据 。 如 同 代码 的 网 络 移动 性 
可 以 简化 系统 管理 员 的 工作 一 样 ， 对 象 的 网 络 移动 性 可 以 简化 软件 开发 者 设计 和 部 署 分 布 
式 系统 的 工作 。 通 过 对 象 序列 化 和 远程 方法 调用 RMD，Java API 提供 了 一 个 在 本 地 对 象 
模型 上 扩展 而 成 的 分 布 式 对 象 模型 ， 打 破 了 Java 虚拟 机 之 间 的 界限 。 分 布 式 对 象 模型 使 得 
一 个 虚拟 机 中 的 对 象 可 以 引用 另 一 个 虚拟 机 中 的 对 象 ， 调 用 那些 远程 对 象 的 方法 ， 在 虚拟 
机 之 间 把 对 象 当 作 参 数 、 返 回 值 或 者 方法 调用 抛 出 的 意外 来 交换 。 这 种 由 Java 底层 基于 网 
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络 的 体系 结构 所 带 来 的 能 力 ， 可 以 简化 设计 分 布 式 系统 的 任务 ， 因 为 它们 有 效 地 把 面向 对 
象 编程 带 入 了 网 络 。 

通过 Java 网 络 友 好 的 底层 体系 结构 ， 以 及 对 象 序列 化 和 RMI 技术 ， 有 一 种 技术 利用 
了 对 象 网 络 移动 性 的 全 部 好 处 ， 那 就 是 Sun 的 JINI 技术 。JINI 是 一 系列 协议 和 API 的 集 
合 ， 可 以 支持 对 分 布 式 系统 的 编写 和 部 署 ， 目 标 是 把 正在 快速 发 展 的 、 没 有 硬盘 的 嵌入 设 
备 连接 到 网 络 中 。JINI 体系 机 构 的 一 个 特别 组 成 部 分 是 服务 对 象 ， 它 可 以 告诉 我 们 对 象 移 
动 性 是 多 么 有 用 。 

JINI 系统 是 以 “查找 服务 ”为 中 心 的 ， 其 他 的 服务 在 “查找 服务 ”中 注册 ， 这 是 通过 
在 对 象 之 间 传 递 一 种 特殊 的 “服务 对 象 ”来 完成 的 。 服 务 对 象 对 客户 机 来 说 就 代表 服务 。 
需要 访问 服务 的 客户 机 从 查找 服务 中 获取 一 个 服务 对 象 的 拷贝 ,通过 调用 服务 对 象 的 方法 
来 和 服务 进行 交互 。 服 务 对 象 负责 实现 服务 一 一 不 管 是 本 地 实现 的 服务 ， 还 是 和 网 络 另 一 
端的 软件 进程 或 者 硬件 对 话 实现 的 服务 。 

提出 JINI 这 一 体系 结构 的 目标 是 将 成 组 的 硬件 设备 和 软件 组 件 联合 成 一 个 单一 的 、 
动态 的 分 布 式 系 统 ， 联 合 后 的 网 络 系统 更 加 易于 管理 和 使 用 ， 同 时 在 保持 单机 的 灵活 性 、 
统一 响应 和 控制 的 情况 下 ， 还 能 够 支持 由 系统 提供 的 共享 能 力 。JINI 这 一 体系 结构 中 有 几 
个 非常 重要 概念 。 

1) 服务 (Service) 

服务 是 一 个 独立 的 功能 实体 ， 它 可 以 被 人 、 程 序 或 者 其 他 服务 使 用 。 服 务 这 一 概念 在 
JINI 中 包括 的 内 涵 非 常 丰富 ， 它 可 以 是 一 次 计算 过 程 或 者 存储 操作 ， 也 可 以 是 和 另 一 个 用 
户 交流 的 通道 ， 甚 至 可 以 是 一 个 硬件 设备 或 者 另 一 个 用 户 。JINI 系统 中 成 员 间 的 联盟 是 为 
了 对 服务 进行 共享 访问 ， 一 个 JINI 联盟 不 应 被 简单 地 看 成 是 客户 机 和 服务 器 的 集合 ， 而 
应 当 看 作 是 组 合 到 一 起 完成 某 个 特定 任务 的 服务 集合 。JINI 提供 了 相应 的 机 制 ， 能 够 在 分 
布 式 系统 中 实现 对 服务 的 构造 、 查 找 、 通 信和 调用 ， 同 时 还 提供 了 一 套 服务 协议 来 负责 服 
务 间 的 通信 。 

2) 客户 (Client) 

JINI 中 的 客户 是 需要 利用 服务 的 硬件 设备 或 软件 组 件 ，JINI 的 目标 是 支持 尽 可 能 多 
的 异 构 客 户 ， 包 括 各 种 硬件 设备 和 软件 平台 。 

3) 查找 服务 (Lookup Service) 

是 JINI 中 的 一 种 服务 协议 ， 它 允许 软 硬 件 发 现 网 络 并 变 成 联盟 中 的 成 员 ， 同 时 将 所 提 
供 的 服务 广播 给 联盟 中 的 其 他 成 员 。 


4.5.2 什么 是 JINI 


在 JINI 的 “思维 ”方式 中 ， 网 络 是 由 “服务 ”组 成 的 ， 客 户 机 或 者 其 他 服务 可 以 利用 
这 些 服务 。 服 务 可 能 是 网 络 上 的 任何 形式 ， 它 们 准备 好 实现 某 种 功能 。 硬 件 设备 、 软 件 服 
务 器 、 或 者 是 通信 信道 ， 甚 至 是 用 户 自己 都 可 以 成 为 服务 。 比 如 说 支持 JINI 的 磁盘 驱动 
器 ， 可 以 提供 “存储 ”服务 。 支 持 JINI 的 打印 机 可 以 提供 “打印 ”服务 。 

为 了 完成 一 项 任务 ， 客 户 机 征用 一 些 服务 来 帮助 它 。 比 如 ， 客 户 程序 可 能 从 数码 相机 
的 图 像 存储 服务 中 抓 取 (上 传 ) 图 片 ， 把 它们 下 传 到 磁盘 驱动 器 提供 的 永久 存储 服务 中 ， 把 
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一 整 页 缩小 的 图 片 发 送 到 彩色 打印 机 提供 的 打印 服务 。 在 这 个 例子 中 ， 客 户 程序 建立 了 一 
个 分 布 式 系统 ， 包 括 程序 本 身 、 图 像 存储 服务 、 永 久 存储 服务 ， 还 有 彩色 打印 服务 。 客 户 
机 和 这 个 分 布 式 系统 中 的 各 个 服务 协同 工作 来 完成 任务 ;把 数码 相机 中 的 照片 取出 来 ， 打 
印 出 一 张 缩 略 图 。 


4.5.3 ”为 什么 需要 JINI 


JINI 可 以 使 人 们 极其 简单 地 使 用 网 络 设备 和 网 络 服务 ， 就 像 今 天 我 们 使 用 电话 一 样 ， 
通过 网 络 拨号 即 插 即 用 。JINI 的 目标 是 最 大 限度 地 简化 与 网 络 的 交互 性 。 

JINI 利用 了 Java 技术 的 优势 。JINI 包含 了 少量 类 库 格 式 的 Java 代码 和 某 些 惯 例 ， 可 
在 网 络 上 创建 一 个 Java 虚拟 机 的 “王国 ”， 就 像 我 们 人 类 创造 一 个 社区 一 样 。 在 这 个 王国 
里 的 人 人、 设备、 数据 和 应 用 程序 等 网 络 公民 均 被 动态 地 连接 起 来 ， 从 而 能 够 共享 信息 和 执 
行 任务 。 

1) 趋势 所 趋 

网 络 的 普及 这 个 世界 正在 网 络 化 。 例 如 ， 在 今天 ， 一 个 企业 要 想 取得 成 功 就 必须 建立 
网 络 。 商 业 网 络 正 在 不 断 扩 大 ， 而 且 已 经 能 够 与 供应 商 和 客户 实现 直接 交互 。 与 无 线 网 络 
的 交互 也 几乎 成 为 家 常 便 饭 。 企 业 和 消费 者 都 要 求 能 与 网 络 进行 更 广泛 的 交流 。 出 差 在 外 
的 人 无 不 希望 在 到 达 饭 店 后 就 能 把 自己 的 计算 机 插入 网 络 接口 ， 不 但 能 与 自己 单位 的 工作 
环境 进行 交互 工作 ， 而 且 还 能 与 饭店 的 本 地 服务 ， 如 打印 机 或 传真 机 等 进行 交互 工作 。 父 
母 可 能 希望 只 需 使 用 移动 电话 或 笔记 本 电脑 就 能 与 家 里 的 摄像 机 相连 ， 通 过 它 来 察看 家 里 
的 情况 。 人 们 无 不 希望 随时 随地 能 够 连接 和 立即 使 用 本 地 的 定制 服务 。 在 不 远 的 将 来 ， 我 
们 将 看 到 网 络 渗透 到 很 多 其 他 环境 。 例 如 ， 将 会 出 现 把 电视 机 和 立体 声 设备 等 音频 /视频 设 
备 与 家 庭 办 公 室 的 电脑 和 外 设 连接 起 来 的 网 络 ， 并 控制 安全 监视 器 和 温 控 恒 温 器 等 网 络 设 
备 。 电 缆 和 ASDL 等 高 带宽 媒介 将 为 家 庭 提供 全 新 的 服务 。 服 务 供应 商 不 断 为 驾驶 员 提 供 
越 来 越 多 的 服务 ， 网 络 也 必 将 随 之 进入 汽车 领域 。 除 导航 系统 外 ， 游 览 景 点 和 当地 餐馆 名 
en 少 断 设备 相连 ， 它 就 能 自动 完 


的 商业 机 遇 是 新 型 的 网 络 服务 。 

例如 ， 产 品 制造 商 将 在 基于 网 络 的 产品 上 提供 新 的 服务 。 例 如 ， 磁 盘 可 被 看 作 与 网 络 
相连 的 存储 服务 ， 能 向 磁带 和 其 他 新 型 服务 提供 自动 存储 备份 。 联 网 的 摄像 机 可 能 将 提供 
诸如 安全 监视 等 新 型 成 像 服务 。 这 些 新 的 服务 使 制造 商 成 为 新 型 的 网 络 服务 供应 商 。 

2) JINI 能 帮助 传统 的 服务 供应 商 提供 新 型 服务 

例如 ， 某 媒体 服务 供应 商 可 能 希望 向 某 消费 者 的 家 庭 打印 机 提供 报纸 打印 服务 。 无 线 
服务 供应 商 可 能 希望 通过 蜂窝 电话 提供 相似 的 服务 。 

3) JINI 可 以 简化 对 现 有 服务 的 管理 

在 隔 天 交 货 的 情况 里 ，JINI 简化 了 分 布 在 各 处 的 工人 与 网 络 连通 的 方式 。 在 个 人 银行 
里 ， 基 于 JINI 的 计算 机 和 外 设 可 简化 分 行 的 系统 管理 。 对 于 无 线 服务 供应 商 ，JINI 可 使 蜂 
窝 电 话 具备 类 似 于 电话 的 网 络 功能 : 屏幕 大 小 、 处 理 能 力 、 使 所 提供 的 服务 根据 每 一 部 电 
话 的 特点 而 专门 设计 。 问 题 是 ， 在 今天 的 环境 中 ， 联 网 还 是 太 复杂 了 。 例 如 ， 无 论 是 把 
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PC 连接 到 网 络 上 ， 还 是 使 用 联网 的 打印 机 都 非常 复杂 。 只 有 经 验 丰 富 的 系统 管理 员 才 有 
能 力 处 理 装载 驱动 程序 、 设 置 配置 文件 等 复杂 的 工作 。 显 然 ， 我 们 不 可 能 指望 一 般 消费 者 
也 能 管理 今天 这 样 复杂 的 网 络 。 

今天 的 网 络 还 很 脆弱 和 很 不 灵活 。 对 网 络 稍 加 改动 就 可 能 造成 不 可 挽救 的 大 混乱 。 向 
网 络 中 添加 诸如 磁盘 存储 等 功能 的 过 程 也 很 复杂 。 例 如 ， 要 想 添加 一 个 磁盘 驱动 器 ， 我 们 
就 必须 打开 机 箱 ， 处 理 设置 跳 线 器 ， 并 解决 一 系列 复杂 的 设置 问题 。 即 使 专家 也 会 头疼 。 

从 消费 者 的 角度 看 ， 他 们 所 需要 的 只 不 过 是 把 硬件 和 软件 插入 联网 的 环境 ， 并 立即 就 
能 使 用 可 用 的 服务 : 就 像 我 们 今天 插 接 电话 一 样 。 在 今天 ， 当 消费 者 从 商店 购买 一 部 电话 
后 ， 他 不 必 对 电话 进行 配置 。 消 费 者 只 需 给 电话 服务 供应 商 打 一 个 电话 ， 服 务 就 会 送 上 
门 。 最后， 消费 者 只 需 把 电话 插 好 ， 就 能 使 用 电话 服务 了 ， 自 主 地 联网 。 

4) 能 够 简化 与 网 络 的 交互 性 

从 消费 者 的 角度 看 ， 消 费 者 把 可 插 接 的 设备 和 软件 插入 网 络 ， 就 像 今天 插 接 一 部 电话 
一 样 简单 。 

从 传统 服务 供应 商 的 角度 看 ，JINI 简化 了 Services Delivery (服务 提供 ) 的 管理 。 设 备 不 
但 能 向 网 络 推出 增值 服务 ， 而 且 还 能 提供 设备 的 属性 和 功能 。 现 在 ， 服 务 供应 商 可 以 针对 
每 台 设 备 设计 服务 。 当 然 ，JINI 还 将 有 可 能 打开 一 扇 通 向 新 的 网 络 化 服务 的 大 门 。 

从 产品 制造 商 的 角度 看 ，JINI 打开 了 全 新 的 市 场 。 因 为 JINI 简化 了 设备 向 网 络 提供 增 
值 服务 的 能 力 。 所 以 ， 产 品 就 不 仅仅 作为 商品 而 投入 竞争 ， 而 是 作为 增值 服务 的 产品 参与 
竞争 。 

从 Java 程序 员 的 角度 看 ，JINI 简化 了 编写 分 布 式 应 用 程序 的 工作 ， 因 而 ， 任 何 Java 
程序 员 都 能 利用 基于 JINI 的 新 设备 编写 应 用 程序 和 服务 。 因 此 ， 企 业 不 再 需要 聘用 有 限 的 
专家 资源 编写 分 布 式 应 用 程序 ， 任 何 Java 程序 员 都 能 为 基于 JINI 的 网 络 开 发 服务 。 

JINI 的 起 源 Bil Joy 在 1994 年 之 前 向 Sun 公司 实验 室 提交 了 一 份 包括 以 下 三 个 主要 概 
念 的 建议 书 : 

可 在 所 有 平台 上 运行 的 语言 、 运 行 该 语言 的 虚拟 机 和 人 允许 分 布 式 虚拟 机 像 单一 系统 那 
样 工作 的 网 络 化 系统 。1995 年 ， 这 种 语言 和 虚拟 机 相继 面市 ， 即 Java 编程 语言 和 Java 虚 
拟 机 。 但 该 系统 的 概念 则 仍 保留 在 Sun 公司 的 研究 与 开发 实验 室 ， 作 进一步 的 研究 和 开 
发 。 这 个 系统 的 概念 就 是 JINI。 

JINI 战略 部 署 与 合作 伙伴 Sun 公司 部 署 了 广泛 的 战略 ， 力 求 将 JINI 推 向 市 场 。 我 们 可 
以 这 样 说 ，JINI 与 任何 向 网 络 化 环境 提供 产品 和 /或 服务 的 企业 都 密切 相关 。 这 包括 传统 的 
设备 制造 商 、 服 务 供应 商 和 软件 开发 商 。 


4.5.4 JINI 的 工作 过 程 


一 个 完整 的 JINI 系统 由 基础 设施 (Infrastructure)、 编 程 模型 (Programming Model)、 服 务 
(Service) 三 个 部 分 组 成 ， 其 体系 结构 如 图 4-6 所 示 。 
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图 4-6 JINI 的 体系 结构 
1. 基础 设施 


基础 设施 用 来 定义 基于 JINI 的 硬件 设备 和 软件 组 件 如 何 连接 并 注册 到 网 络 ， 它 包括 
以 下 4 个 组 成 部 分 : 
口 JavaRMI 扩展 实现 : 是 JINI 系统 中 的 构件 在 通信 时 所 采用 的 底层 通信 机 制 。 
口 “分 布 式 安全 系统 : 用 于 将 Java 平台 的 安全 模型 扩展 到 分 布 式 JINI 系统 ， 并 定 
义 联 盟 成 员 的 使 用 权限 。 
口 发现/ 加 入 (Discovery/Join) 协 议 ， 是 一 种 服务 协议 ， 允 许 软 硬件 发 现 网 络 并 成 为 
联盟 的 成 员 ， 同 时 将 所 提供 的 服务 广播 给 联盟 中 的 其 他 成 员 。 
口 ” 查 找 (Lookup) 服 务 ， 是 网 络 中 所 有 服务 的 公告 牌 (Bulletin Board)， 用 来 展示 联盟 中 
的 所 有 成 员 ， 并 且 帮 助 使 用 者 在 联盟 中 寻找 所 需 的 资源 和 服务 。 
JINI 基础 设施 负责 实现 添加 、 删 除 、 定 位 和 访问 服务 的 相关 机 制 ， 它 通常 驻 留 在 网 络 
中 的 三 个 地 方 : 在 查找 服务 中 ， 在 服务 提供 者 中 ， 或 者 在 客户 中 。JINI 基础 设施 的 核心 是 
Lookup、Discovery 和 Join 三 条 协议 ， 它 们 使 得 基于 JINI 的 任何 服务 都 可 以 随时 加 入 或 
者 退出 联盟 ， 并 且 在 加 入 联盟 时 无 需 进 行 安 装 和 配置 ， 从 而 达到 了 即 揪 即 用 的 效果 。 
查找 服务 (Lookup Service) 是 JINI 体系 结构 中 的 基本 组 成 部 分 ， 它 负责 在 分 布 式 系统 
中 提供 对 服务 的 中 央 注 册 机 制 。 一 旦 进入 JINI 的 世界 ， 如 果 想 找到 所 需 的 服务 就 必须 通 
过 查找 服务 ， 此 外 ， 查 找 服 务 还 是 为 管理 员 和 用 户 提供 各 种 访问 接口 的 基础 。 在 一 定 程度 
上 你 可 以 将 查找 服务 看 成 是 网 络 中 所 有 服务 的 公告 牌 ， 它 维护 着 各 个 服务 所 提供 的 功能 接 
口 与 实现 该 服务 的 对 象 集 间 的 映射 关系 。JINI 中 的 客户 通过 使 用 查找 服务 在 分 布 式 网 络 中 
查找 和 调用 所 需 的 服务 ， 而 查找 服务 中 的 对 象 本 身 可 以 包含 其 他 查找 服务 ， 从 而 构成 层次 
式 的 查找 服务 。 
当 硬件 设备 或 者 应 用 程序 进入 网 络 时 ， 它 所 提供 的 服务 如 何 被 JINI 发 现 并 接纳 ， 并 


人 
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进一步 成 为 整个 JINI 分 布 式 系统 中 的 某 项 服务 ， 需 要 经 过 两 个 必 不 可 少 的 重要 步骤 。 第 
一 步 是 找到 系统 中 的 查找 服务 ， 这 个 过 程 称 为 发 现 (Discovery)， 所 用 到 的 协议 是 发 现 协 
议 。 第 二 步 是 将 自己 注册 到 查找 服务 中 ， 这 个 过 程 称 为 加 入 (Join)， 描 述 这 个 过 程 的 协议 是 
Join 协议 。 一 个 JINI 服务 只 有 在 成 功 完成 了 这 两 个 步骤 之 后 ， 才 能 正式 成 为 联盟 中 的 一 
员 ， 并 开始 向 外 界 提 供 相 应 的 服务 。 

在 JINI 这 一 分 布 式 计算 环境 中 ， 服 务 提供 者 所 提供 的 服务 既 可 能 是 硬件 也 可 能 是 软 
件 。 当 某 一 服务 提供 者 需要 加 入 到 JINI 系统 中 时 ， 它 首先 必须 找到 网 络 中 的 查找 服务 ， 
于 是 它 在 局 域 网 中 进行 广播 ， 请 求 加 入 到 查找 服务 中 。 附 近 的 查找 服务 在 收 到 相应 的 请 求 
后 负责 识别 并 接纳 该 服务 ， 整 个 过 程 称 之 为 发 现 。 需 要 注意 的 是 ， 服 务 提供 者 必须 包含 用 
于 通讯 的 服务 对 象 (Service Object) 和 描述 该 服务 特点 的 服务 属性 (Service Attributes)。 

当 查 找 服 务 找到 之 后 ， 服 务 提供 者 将 与 查找 服务 直接 进行 通讯 ， 把 自己 的 服务 对 象 和 
服务 属性 注册 到 查找 服务 中 ， 换 句 话说 就 是 把 服务 对 象 和 服务 属性 发 送 到 查找 服务 中 去 。 
这 个 过 程 称 为 加 入 。 

一 旦 服务 被 成 功 地 加 入 到 查找 服务 中 后 ， 如 果 JINI 系统 中 的 客户 需要 使 用 该 服务 ， 
它 可 以 根据 服务 的 类 型 或 者 属性 向 查找 服务 查询 合适 的 服务 ， 查 找 服 务 负 责 把 查询 后 的 
结果 返回 给 客户 ， 当 客户 决定 使 用 该 服务 时 ， 查 找 服务 还 会 将 该 服务 对 象 的 拷贝 发 送 给 
客户 。 

JINI 客户 从 查找 服务 那里 获得 的 服务 对 象 是 一 个 Java 接口 (Interface)， 其 中 包括 用 来 
调用 服务 的 方法 名 称 和 参数 ， 以 及 其 他 一 些 描述 信息 。JINI 客户 通过 获得 的 服务 对 象 与 服 
务 提供 者 进行 直接 联系 ， 获 得 相应 的 服务 。 服 务 对 象 负责 处 理 客户 与 服务 提供 者 之 间 的 通 
信 ， 从 而 向 用 户 隐藏 了 服务 的 具体 实现 细节 。 


2. 编程 模型 


JINI 是 一 个 分 布 式 的 计算 环境 ， 其 编程 模型 自然 也 是 分 布 式 的 ， 编 程 模型 在 JINI 的 
体系 结构 中 占有 非常 重要 的 地 位 ， 其 基础 设施 正 是 借助 这 一 编程 模型 有 机 地 结合 在 了 一 
起 。JINI 的 编程 模型 主要 包括 以 下 几 个 方面 。 

1) 租用 (Leasing) 

在 分 布 式 系统 中 有 一 个 非常 严重 的 问题 ， 那 就 是 不 能 保证 服务 不 突然 崩溃 。 例 如 ， 当 
一 台数 字 相 机 通过 查找 服务 加 入 到 JINI 网 络 中 时 ， 将 对 外 发 布 信 息 表明 自己 可 用 且 一 切 
正常 ， 但 如 果 此 时 用 户 在 不 正常 关闭 设备 的 情况 下 随意 将 相机 拔 掉 ， 相 应 的 问题 就 产生 
了 。 因 为 对 联盟 中 的 其 他 成 员 来 说 ， 此 时 它们 无 法 判断 是 相机 所 连接 的 远程 主机 已 经 关 
掉 ， 还 是 响应 速度 比较 慢 ， 或 是 相机 本 身 产生 了 故障 。 为 了 解决 这 个 问题 ，JINI 使 用 了 一 
种 称 为 租用 的 技术 。 租 用 的 基本 思想 是 : 不 再 保证 可 以 在 任意 长 的 时 间 内 访问 资源 ， 而 是 
只 能 在 一 段 固定 时 间 内 将 资源 “ 借 给 ” 某 使 用 者 。 租 用 机 制 使 得 客户 对 服务 的 访问 是 基于 
租约 的 ， 租 约 保证 了 一 段 时 间 内 的 授权 访问 ， 租 约 必 须 在 服务 的 使 用 者 和 服务 提供 者 之 间 
进行 协商 。 租 约 在 到 期 之 前 如 果 不 续 约 的 话 ， 相 应 的 资源 将 被 释放 。 租 约 可 以 是 唯一 的 ， 
也 可 以 不 是 唯一 的 ， 非 唯一 租约 允许 多 用 户 共享 同一 资源 。 

2) 分 布 式 事件 (Distributed Events) 

和 Java 类 似 ，JINI 也 使 用 事件 的 概念 来 处 理 异步 通知 ， 事 件 可 以 被 理解 成 是 一 个 包 
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含 外 部 状态 变化 信息 的 对 象 。 例 如 ， 当 鼠标 状态 在 AWT 中 发 生变 化 时 ， 不 论 是 移动 、 点 
击 还 是 释放 ， 都 将 产生 一 个 MouseEvent 事件 ， 事 件 产生 后 将 被 直接 发 送 到 希望 得 到 该 信 
息 的 相关 实体 (Listener)。JINI 的 事件 模型 和 Java 的 非常 类 似 ， 但 它 同 时 还 能 够 支持 分 布 
式 事件 。JINI 的 编程 模型 允许 一 个 对 象 注册 对 其 他 对 象 感 兴趣 的 事件 ， 并 且 在 该 事件 发 生 
时 能 立即 得 到 相应 的 通知 ， 这 就 使 得 基于 事件 的 分 布 式 程序 能 以 有 多 种 可 靠 性 和 扩展 性 保 
证 的 方式 编写 。 

3) 事务 (Transaction) 

分 布 式 计算 中 另 一 个 非常 辐 手 的 问题 是 部 分 失败 ， 所 谓 部 分 失败 指 的 是 整个 计算 过 程 
中 的 某 一 步 产生 了 错误 ， 或 者 计算 所 需 的 某 个 组 成 部 分 出 现 了 故障 。 假 如 ， 银 行 想 在 两 个 
账户 间 进 行 转账 ， 即 从 一 个 账户 中 减 去 一 定数 量 的 金额 然后 加 到 另 一 个 账户 上 ， 是 不 是 只 
要 编写 一 段 代码 实现 从 A 账户 中 减 去 一 定 的 金额 ， 然 后 再 用 另外 一 段 代码 实 现 向 B 账户 
中 加 入 同样 的 金额 就 可 以 了 呢 ? 看 起 来 似乎 没有 什么 问题 ， 但 实际 上 却 存在 非常 严重 的 错 
误 ， 如 果 资 金 从 账户 A 转 出 之 后 机 器 就 崩溃 了 ， 很 明显 B 将 永远 无 法 得 到 ， 而 产生 这 一 
问题 的 根本 原因 就 是 没有 考虑 到 程序 可 能 会 部 分 失败 。JINI 通过 引入 事务 的 概念 解决 了 部 
分 失败 这 一 问题 ， 事 务 是 将 一 系列 相关 操作 进行 分 组 ， 以 保证 所 有 操作 要 么 全 部 成 功 ， 要 
么 全 部 失败 的 一 种 方法 。 采 用 事务 的 好 处 是 无 论 在 执行 过 程 中 出 现 什么 情况 ， 系 统 都 将 进 
入 一 个 确定 的 状态 ， 这 样 处 理 起 来 就 相对 容易 多 了 : 事务 成 功 则 继续 进行 ， 事 务 失 败 则 稍 
后 再 试 。 事 务 最 早出 现在 数据 库 理论 中 ， 目 前 已 经 出 现 了 许多 实用 的 事务 模型 ，JINI 中 采 
用 的 是 两 阶段 提交 (Two-phase Commit) 这 一 事务 模型 。 


3. 服务 


JINI 的 基础 设施 和 编程 模式 使 得 服务 能 够 在 分 布 式 环境 中 被 注册 和 发 现 ， 并 能 够 向 用 
户 宣布 自己 的 存在 。 服 务 是 JINI 体系 结构 中 一 个 非常 重要 的 概念 ， 它 可 以 用 来 表示 组 织 
在 一 起 形成 JINI 联盟 的 各 个 实体 ， 这 里 所 指 的 实体 可 以 是 硬件 、 软 件 或 者 软 硬 件 的 
结合 。 

JINI 中 的 每 个 服务 都 有 一 个 接口 描述 ， 该 接口 定义 了 客户 可 以 向 这 个 服务 请 求 的 所 有 
操作 ， 并 且 反 映 了 服务 的 类 型 。JINI 中 的 服务 是 可 以 聚合 的 ， 即 允许 一 个 服务 由 多 个 子 服 
务 组 合 而 成 。 整 个 JINI 体系 结构 中 最 重要 的 一 个 服务 是 查找 服务 ， 它 是 JINI 基础 设施 
的 一 个 子 组 件 ， 其 他 作为 JINI 体系 结构 组 成 部 分 并 实现 为 JINI 服务 的 对 象 包括 : 

(1) JavaSpace: 为 JINI 中 的 对 象 提 供 了 一 个 可 选 的 分 布 式 持续 性 保存 机 制 ， 并 能 够 
被 用 来 进行 简单 的 通信 。 

(2) 事务 管理 器 : 为 JINI 中 的 对 象 提供 分 布 式 事务 服务 ， 人 允许 对 象 参与 到 由 编程 模 
式 所 定义 的 两 阶段 提交 协议 。 


4.5.5 服务 对 象 的 优点 


在 JINI 系统 中 ， 网 络 移动 性 对 象 可 以 移动 到 任何 地 方 。 当 客户 机 或 者 服务 进行 探索 的 
时 候 ， 它 会 从 查找 服务 受到 一 个 服务 注册 器 。 当 通过 服务 注册 器 进行 加 入 的 时 候 ， 它 会 传 
送 一 个 服务 条 目 对 象 给 查找 服务 ， 而 服务 条 目 本 身 也 是 一 个 包含 了 很 多 对 象 的 容器 ， 其 中 
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包括 属性 和 服务 对 象 。 当 客户 进行 查找 的 时 候 ， 它 会 发 送 一 个 服务 模板 对 象 ， 包 含 一 系列 
对 象 ， 表 示 查 询 需 要 的 搜索 条 件 。 如 果 查 询 成 功 了 ， 客 户 机 会 收 到 匹配 查询 的 服务 对 象 ， 
或 者 是 服务 的 整个 服务 条 目 。 

这 些 在 网 络 上 客户 机 、 服 务 和 查找 服务 之 间 移 动 的 对 象 到 底 能 对 分 布 式 程序 有 什么 好 
处 呢 ? 简单 说 来 ，JINI 使 用 的 网 络 移动 的 对 象 (特别 是 网 络 移动 的 服务 对 象 ) 提 高 了 分 布 式 
系统 编程 的 抽象 级 别 ， 有 效 地 把 网 络 编程 转变 为 面向 对 象 编程 。 

JINI 体系 通过 把 面向 对 象 编程 引入 网 络 ， 带 来 了 面向 对 象 的 一 个 基本 有 点 : 接口 和 实 
现 分 离 。 比 如 ， 服 务 对 象 允许 客户 机 用 好 几 种 方法 来 获取 服务 ， 客 户 从 查询 服务 下 载 、 在 
本 地 运行 的 服务 对 象 可 以 代表 整个 服务 。 或 者 说 ， 服 务 对 象 可 以 作为 远程 服务 器 的 一 个 代 
理 。 当 客户 机 调用 服务 对 象 的 方法 的 时 候 ， 它 把 请 求 通过 网 络 传送 回 服务 器 ， 那 才 是 真正 
工作 的 地 方 。 本 地 服务 对 象 和 远程 服务 器 也 可 能 共同 分 担 工作 。 

JINI 体系 的 一 个 重要 推论 就 是 ， 在 服务 对 象 代理 和 远程 服务 器 之 间 使 用 的 网 络 协议 ， 
客户 机 是 无 需 关 心 的 额 。 网 络 协议 是 实现 服务 的 一 部 分 ， 协 议 完全 是 服务 开发 者 的 私人 事 
务 。 客 户 机 可 以 通过 这 种 私有 协议 和 服务 器 交互 ， 因 为 服务 把 它 自己 的 服务 对 象 送 到 客户 
机 的 地 址 空间 中 一 一 服务 对 象 在 服务 和 客户 机 的 网 络 上 来 回 传送 。 注 入 客户 机 的 服务 对 象 
可 以 用 任何 协议 和 后 端的 服务 通信 ，RMI、CORBA、DCOM,， 或 者 是 自己 在 socket 和 流 上 
面 建立 的 协议 ， 甚 至 是 其 他 的 任何 方法 。 客 户 端 完全 不 需要 关心 网 络 协议 ， 因 为 它 只 需 和 
服务 对 象 实现 的 公开 接口 打交道 。 服 务 对 象 负责 人 和 需要 进行 的 网 络 交 流 。 

同一 服务 接口 的 不 同 实现 可 以 使 用 完全 不 同 的 方法 和 完全 不 同 的 网 络 协议 。 服 务 可 能 
使 用 特制 的 硬件 来 满足 客户 机 的 请 求 ， 或 者 使 用 软件 实现 所 有 功能 。 服 务 不 同 的 实现 方法 
可 以 针对 不 同 的 环境 优化 。 另 外 ， 服 务 采 用 的 方法 可 能 随时 间 而 变化 ， 客 户 机 可 以 确信 服 
务 对 象 了 解 服务 是 如 何 实现 的 ， 因 为 客户 机 就 是 从 服务 那儿 取得 这 个 服务 对 象 的 。 对 于 客 
户 机 来 说 ， 不 管 服务 是 如 何 实现 的 ， 任 何 服务 看 起 来 都 是 公开 的 接口 。 

因此 ，JINI 试图 提升 分 布 式 系统 编程 的 抽象 级 别 ， 从 网 络 协议 级 别提 升 到 对 象 接口 级 
别 ， 在 越 来 越 多 嵌入 式 设备 都 要 连接 到 网 络 上 的 情况 下 ， 分 布 式 系 统 的 各 个 部 分 可 能 来 自 
不 同 的 供应 商 。JINI 让 供应 商 不 需要 依附 于 某 一 种 底层 网 络 协议 (这 种 协议 让 它们 的 设备 互 
联 )。 相 反 ， 供 应 商 只 需要 在 互联 设备 的 高 层 Java 接口 层 上 达成 一 致 就 可 以 了 。 讨 论 的 级 
别 从 网 络 协议 层 提升 到 对 象 接口 层 ， 可 以 让 供应 商 更 加 集中 于 高 层 的 概念 而 非 拘泥 在 基层 
细节 中 。JINI 讨论 的 高 层 问 题 可 以 使 类 似 产品 的 供应 商 达 成 一 个 一 致 协议 ， 来 描述 它们 的 
服务 如 何 和 客户 机 交互 。 

除 此 之 外 ，JINI 体系 允许 软件 开发 者 在 开发 分 布 式 系统 时 享受 接口 和 实现 分 离 的 便 
利 。 一 个 好 处 是 良好 设计 的 对 象 接 口 可 以 使 软件 开发 者 在 大 规模 的 分 布 式 系统 项 目 中 更 加 
有 效 地 协同 开发 。 对 象 接口 为 面向 对 象 程序 的 各 个 部 分 之 间 签 订 了 人 合同， 同样 ， 对 象 接口 
也 可 以 用 来 明确 大 项 目 中 团队 成 员 之 间 的 互相 合作 关系 ， 他 们 每 人 负责 一 块 程序 。 接 口 和 
实现 分 离 的 另外 一 个 好 处 就 是 ， 程 序 员 可 以 用 它 来 减少 变化 带 来 的 冲击 ， 因 为 耦合 度 降 低 
了 。 设 计 良 好 的 对 象 直接 结合 的 唯一 途径 就 是 它们 的 接口 ， 实 现 者 在 对 象 内 部 做 的 改变 不 
会 影响 到 其 他 对 象 中 的 代码 。 

通过 为 分 布 式 系统 编程 提升 抽象 层次 和 提供 清晰 的 分 离 接口 和 实现 ，JINI 带 来 了 面向 
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对 象 的 好 处 。 这 都 是 因为 Java 对 网 络 移动 对 象 的 支持 。 对 象 在 网 络 上 移动 ， 是 通过 Java 
的 底层 结构 ， 对 象 序列 化 ，RMI 来 实现 的 ， 并 通过 JINI 服务 对 象 展示 出 来 ， 这 些 技术 给 网 
络 带 来 了 巨大 的 好 处 。 


4.5.6 JINI 技术 的 运作 


可 以 将 JINI 技术 划分 为 两 个 范畴 : 体系 结构 和 分 布 式 编程 。 此 外 ， 还 将 提供 在 JINI 
上 运行 的 网 络 服务 。 

1) 基础 结构 

JINI 基础 结构 解决 设备 和 软件 如 何 与 网 络 连接 并 进行 注册 等 基本 问题 。 基 础 结构 的 第 
一 种 要 素 称 作 Discovery and Join (发 现 与 联合 )。Discovery and Join 解决 设备 和 应 用 程序 在 
对 网 络 一 无 所 知 的 情况 下 如 何 向 网 络 进行 首次 注册 这 样 的 难题 。 
基础 结构 的 第 二 个 要 素 是 Lookup( 搜 索 )，Lookup 可 以 被 看 作 是 网 络 中 所 有 服务 的 公告 
各 个 搜索 元 素 的 具体 说 明 如 下 。 
口 “Network Services: 网 络 服务 。 
Other Services: 其 他 服务 。 
Leasing: 租用 。 
Transactions: 交易 。 
Distributed Event: 分 布 式 事件 。 
Other OS: 其 他 操作 系统 。 
Other CPU: 其 他 CPU。 
DISCOVERY AND JOIN: 设备 或 应 用 程序 插入 网 络 后 需要 完成 的 第 一 个 任务 就 
是 发 现 该 网 络 ， 并 使 网 络 发 现 该 设备 或 应 用 程序 。 我 们 之 所 以 使 用 Discovery and 
Join 这 样 的 说 法 ， 是 因为 设备 或 应 用 程序 事前 不 可 能 对 网 络 有 任何 了 解 。 

Discovery 的 工作 原理 ， 当 基于 JINI 的 设备 插入 网 络 后 ， 它 就 通过 一 个 众所周知 的 端 
口 向 网 络 发 送 一 个 512 字 节 的 多 路 广播 Discovery 包 。 在 其 他 信息 中 ， 该 包 包含 对 自己 的 
引用 。 

JINI Lookup 在 众所周知 的 端口 上 进行 监听 。 当 接收 到 Discovery 包 后 ，Lookup 就 利用 
该 设备 的 接口 将 Lookup 的 接口 传递 回 插 接 的 设备 或 应 用 程序 。 

现在 ， 该 设备 或 应 用 程序 已 经 发 现 了 该 网 络 ， 并 准备 将 其 所 有 特性 上 载 到 JINI 
Lookup。 上 载 特性 是 Discovery and Join 中 Join 这 方面 的 特性 。 

现在 该 设备 或 应 用 程序 使 用 在 Discovery 阶段 所 接收 到 的 Lookup 接口 与 网 络 相连 。 上 
载 到 Lookup 的 特性 包括 该 设备 或 应 用 程序 所 提供 的 所 有 增值 服务 (如 驱动 程序 、 帮 助 向 
导 、 属 性 等 )。 

LookupLookup 是 网 络 上 所 有 服务 的 网 络 公告 板 。Lookup 不 但 存储 着 指向 网 络 上 服务 
的 指针 ， 而 且 还 存储 着 这 些 服 务 的 代码 或 代码 指针 。 

例如 ， 当 打印 机 向 Lookup 注册 时 ， 打 印 机 将 打印 机 驱动 程序 或 驱动 程序 接口 上 载 到 
Lookup。 当 客户 机 需要 使 用 打印 机 时 ， 该 驱动 程序 和 驱动 程序 接口 就 会 从 Lookup 下 载 到 
客户 机 。 这 样 ， 就 不 必 事 先 把 驱动 程序 装载 到 客户 机 上 。 
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打印 机 还 可 能 把 其 他 增值 服务 装载 入 Lookup。 例 如 ， 打 印 机 可 能 存储 关于 自己 的 属性 
(如 它 是 否 支 持 postscript， 或 它 是 否 为 彩色 打印 机 )。 打 印 机 还 可 能 存储 可 在 客户 机 上 运行 
的 帮助 向 导 。 

如 果 网 络 上 没有 Lookup， 则 网 络 就 会 使 用 一 个 Peer Lookup (对 等 Lookup ) 程 序 。 当 需 
要 服务 的 客户 机 在 网 络 上 找 不 到 Lookup 时 ，Peer Lookup 就 开始 工作 。 在 这 种 情况 下 ， 客 
户 机 可 发 送 与 Lookup 所 用 的 相同 的 Discovery and Join 包 ， 并 要 求 任 何 服务 供应 商 进 行 注 
册 。 随 后 ， 服 务 供应 商 就 会 在 客户 机 上 注册 ， 尽 管 那 不 是 Lookup。 分 布 式 编程 JINI 分 布 
式 编程 为 Java 增添 了 创建 分 布 式 系统 所 必需 的 其 他 功能 。 尤 其 是 JINI 分 布 式 编程 可 提供 
租用 、 分 布 式 交易 和 分 布 式 事件 。 

在 JINI 中 ， 对 象 彼此 之 间 商 定 租 期 。 例 如 ， 当 某 设 备 使 用 Discovery and Join 协议 发 
现 网 络 时 ， 它 就 注册 一 段 租 用 时 间 。 在 租约 到 期 之 前 ， 该 设备 必须 重新 商定 租 期 。 这 样 ， 
如 果 租约 到 期 或 设备 拔 下 后 ， 该 设备 在 Lookup 中 的 记录 就 会 被 自动 删除 。 这 就 是 分 布 式 
垃圾 收集 的 工作 原理 。 

2) 分 布 式 的 影响 

分 布 式 事件 在 单一 的 计算 机 中 ， 事 件 肯定 能 被 接收 方 接收 到 ， 序 列 也 肯定 能 按照 顺序 
进行 。 但 是 在 分 布 式 环境 中 ， 分 布 的 事件 可 能 不 是 按照 顺序 被 接收 ， 或 者 ， 某 个 事件 还 可 
能 丢失 。 

为 了 便于 在 Java 环境 中 处 理 分 布 的 事件 ，JINI 为 分 布 的 事件 提供 了 一 个 简单 的 Java 
API。 例 如 ， 当 一 个 分 布 的 事件 发 生 时 ， 该 事件 都 带 有 一 个 事件 号 和 序列 号 。 利 用 这 种 信 
息 ， 接 收 方 就 能 检查 事件 是 否 丢失 (序列 号 丢失 ) 或 事件 是 否 按照 顺序 接收 (序列 号 顺序 不 
对 ) 到 。 

分 布 式 交易 在 分 布 式 Java 环境 中 ， 有 时 需要 一 种 很 简便 的 方法 ， 来 确保 在 整个 交易 完 
成 之 前 ， 在 该 交易 中 发 生 的 所 有 事件 都 被 真正 提交 了 (两 阶段 提交 )。 

为 便于 进行 此 类 分 布 式 计算 ，JINI 提供 了 一 种 简单 的 Java API。 该 API 可 使 对 象 启动 
一 个 能 管理 交易 的 交易 管理 器 。 每 个 参与 交易 的 对 象 都 向 交易 管理 器 注册 。 

当 发 生 交易 时 ， 如 果 某 个 参与 的 对 象 说 ， 交 易 中 的 某 个 事件 没有 发 生 ， 则 此 信息 就 被 
送 回 交 易 管 理 器 。 随 后 ， 交 易 管 理 器 就 告诉 所 有 参与 的 对 象 回 滚 (Rool Back) 到 前 一 个 已 知 
状态 。 类 似 的 ， 如 果 所 有 对 象 都 完成 了 其 交易 的 过 程 ， 则 整个 交易 就 向 前 进行 。 

JINI 上 的 网 络 服务 在 JINI 基础 结构 和 分 布 式 编程 之 上 ， 可 提供 便于 分 布 式 计算 的 网 络 
服务 。JavaSpace 就 是 这 样 的 一 种 网 络 服务 。 


4.5.7 ”如 何 启动 JINI 


JINI 目前 还 处 于 研发 的 早期 阶段 ， 因 此 迄今 为 止 还 没有 哪个 JINI 实现 系统 声称 它 可 
以 真正 投入 实际 使 用 ， 自 然 也 就 没有 完全 遵循 JINI 规范 的 服务 或 者 设备 出 现 。 尽 管 如 
此 ，JINI 试图 去 解决 的 问题 对 许多 软 硬 件 厂商 来 讲 已 经 非常 急切 了 ， 因 此 Java 给 出 了 一 
个 JINI 的 参考 实现 系统 JINI Technology Starter Kit， 读 者 可 以 从 http:/www.sun.comy 
software /INI 上 下 载 ， 目 前 最 为 常用 的 版 本 是 2.0。 

从 Java 官方 网 站 下 载 到 JINI Technology Starter Kit Version 2.0 的 源码 包 JINL2 0- 
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src.zip 后 ， 假 设 将 其 解压 缩 到 d:JINI2 0\ 目 录 下 。 由 于 JINI 建立 在 一 系列 其 他 服务 的 基 
础 之 上 ， 因 此 在 正式 启动 JINI 之 前 还 必须 先 对 这 些 服 务 进行 配置 ，JINI Technology 
Starter Kit 开发 包 中 集成 了 一 些 支持 JINI 运行 所 必需 的 基本 服务 。 

1) HTTP 服务 器 

在 通过 RMI 下 载 代码 时 ， 需 要 利用 HTTP 协议 完成 传输 ， 因 此 在 运行 JINI 时 需要 一 
个 HTTP 服务 器 。JINI Technology Starter Kit 带 有 一 个 非常 简单 的 HTTP 服务 器 ， 但 它 
对 于 供 在 应 用 程序 间 传 送 代码 已 经 完全 足够 了 。 通 常情 况 下 ， 需 要 在 每 个 供 其 他 应 用 程序 
下 载 代码 的 机 器 上 运行 一 个 HTTP 服务 器 。 

2) RMI 激活 守护 进程 

这 是 JINI Technology Starter Kit 基础 结构 中 非常 实用 的 一 个 部 分 ， 它 使 得 那些 很 少 被 
调用 的 对 象 基本 保持 在 “睡眠 ”状态 ， 在 需要 时 又 能 够 被 自动 “唤醒 ”。RMI 激活 守护 进 
程 负责 管理 对 象 在 活跃 和 非 活跃 状态 间 的 切换 ， 并 被 其 他 JINI 运行 时 核心 服务 所 调用 ， 
它 至 少 应 该 在 查找 服务 所 处 的 主机 上 运行 。 

3) 查找 服务 

查找 服务 才 是 JINI 的 核心 ， 它 负责 记录 网 络 中 当前 激活 的 所 有 服务 。 尽 管 JDK 中 
的 RMI 注册 服务 也 可 以 作为 查找 服务 使 用 ， 但 不 推荐 使 用 ，JINI Technology Starter Kit 
中 提供 的 查找 服务 具有 更 加 丰富 和 完善 的 功能 。 当 出 现 故 障 或 重新 启动 之 后 ， 查 找 服务 需 
要 依靠 RMI 激活 守护 进程 来 恢复 其 状态 ， 因 此 在 运行 查找 服务 的 机 器 上 必须 同时 运行 
RMI 激活 守护 进程 。 

JINI Technology Starter Kit v2.0 在 它 的 toolsjar 包 中 自 带 了 一 个 HITP 服务 器 ， 我 们 
可 以 在 d:JINI2_O0\script\ 目 录 下 创建 一 个 内 容 如 下 的 批 处 理 文件 来 启动 它 。 

代码 清单 1 start-httpd.bat 

@rem 启动 HTTP 服务 器 的 批 处 理 文件 

java -jar lib\tools.jar -port 8080 -dir lib -verbose 

在 缺 省 情况 下 ，HTTP 服务 器 将 运行 在 8080 端口 ， 但 如 果 此 时 系统 中 已 经 有 一 个 
Web 服务 器 运行 在 8080 端口 了 ， 那 么 可 以 用 -port 参数 把 JINI 的 HTTP 服务 器 指定 到 
另外 的 端口 。 参 数 -dir 可 以 用 来 设置 HTTP 服务 器 的 根 目 录 ， 在 上 面 的 例子 中 将 其 设置 为 
JINI 的 lib 目录 ， 这 样 做 的 好 处 是 JINI 的 核心 代码 可 以 被 直接 下 载 。 最 后 那个 参 
数 -verbose 是 用 于 调试 的 ， 它 要 求 HITP 服务 器 显示 所 有 来 自 客户 端的 请 求 信息 以 及 这 些 
请 求 的 来 源 。 

RMI 激活 守护 进程 rmid 是 由 JDK 所 提供 的 ， 它 必须 在 可 激活 对 象 所 在 的 每 一 台 主 
机 上 运行 ， 其 中 包括 JINI 查找 服务 、 事 务 管理 器 和 JavaSpace。 如 果 你 已 经 成 功 地 配置 
好 了 JDK， 那 么 可 以 在 dVINI2_0\script\ 目 录 下 创建 一 个 内 容 如 下 的 批 处 理 文件 来 启动 它 : 

代码 清单 2 start-rmid.bat 

@rem 启动 RMI 激活 守护 进程 的 批 处 理 文件 
rmid -J-Dsun.rmi .activation.execPolicy=none 

在 JINI Technology Starter Kit v2.0 中 是 通过 Reggie 实现 查找 服务 的 ， 它 位 于 reggie.Jjar 

包 中 ， 启 动 这 个 服务 比 启动 其 他 服务 要 稍微 复杂 一 些 。 首 先 在 d:JINI2_0\config\ 目 录 下 为 
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Reggie 创建 一 个 内 容 如 下 的 安全 策略 文件 : 
代码 清单 3 allLpolicy 


/* 安全 策略 文件 */ 

grant codeBase "file:lib${/}*" { 
permission java.security.AllPermission; 

] 7 


然后 在 d:JINI2_0\config\ 目 录 下 为 Reggie 创建 一 个 内 容 如 下 的 启动 配置 文件 : 
代码 清单 4 start-reggie.config 


/* 启动 Reggie 查找 服务 的 配置 文件 */ 
import com.sun.JINI.config.ConfigUtil; 
import com.sun.JINI.start.NonActivatableServiceDescriptor; 
import com.sun.JINI.start.ServiceDescriptor; 
com.sun.JINI.start { 
private static codebase = 
ConfigUtil.concat( 
new Object[] { 
"http://", 
ConfigUtil .getHostName () ， 
":8080/reggie-dl.jar" }); 
private static policy = "config${/}all.policy"; 
private static classpath = "lib${/}reggie.jar"; 
private static config = "config${/}reggie.config"; 
static serviceDescriptors = 
new ServiceDescriptor[] { 
new NonActivatableServiceDescriptor( 
Codebase, 
policy, 
classpath, 
"com.sun.JINI.reggie.TransientRegistrarImpl", 
new String[] { config }) 
ks 
} 


最 后 再 在 d:\JINI2_0\config\ 目 录 下 为 Reggie 创建 一 个 内 如 下 容 的 配置 文件 : 


代码 清单 5 reggie.config 
/* Reggie 查找 服务 的 配置 文件 */ 
import net.JINI.jrmp.JrmpExporter; 
com.sun.JINI.reggie { 
serverExporter = new JrmpExporter(); 


initialMemberGroups = new String[] { "example.JINI.sun.com" }; 
} 


为 了 简化 Reggie 查找 服务 的 启动 过 程 ， 我 们 可 以 在 d:\JINI2_O\script\ 目 录 下 创建 一 个 
如 下 内 容 的 批 处 理 文件 : 
代码 清单 6 start-reggie.bat 


erenm 启动 Reggie 查找 服务 的 批 处 理 文件 
java -Djava.security.policy=config\all.policy 
-jar lib\start.jar config\start-reggie.config 
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这 样 在 需要 启动 HTTP 服务 器 、RMI 激活 守护 进程 或 者 Reggie 查找 服务 时 ， 只 用 在 
命令 行 方 式 下 依次 执行 如 下 命令 即 可 : 


D:\JINI2 0> start script\start-httpd 
D:\JINI2 0> start script\start-rmid 
D:\JINI2 0> start script\start-reggie 


在 JINI 的 世界 中 ， 所 有 可 用 的 资源 都 被 看 成 是 服务 ， 而 对 服务 的 查询 和 检索 则 是 最 
频繁 的 操作 之 一 ， 为 此 JINI Technology Starter Kit v2.0 专用 提供 了 一 个 实用 工具 
Browser， 利 用 它 可 以 查询 当前 JINI 网 络 中 的 所 有 服务 。 为 了 简化 Browser 的 启动 ， 可 
以 在 “qd:JINI2_O\script\” 目 录 下 创建 一 个 内 容 如 下 的 批 处 理 文件 : 

代码 清单 7 start-browser.bat 

@rem 启动 Browser 的 批 处 理 文件 


java -Djava.security.policy=config\all.policy - 
Djava.rmi.server.codebase= 
http://Sscomputernames:8080/browser-dl.jar -jar lib\browser.jar 


此 时 要 想 启动 Browser， 只 要 在 命令 行 方式 下 依次 执行 如 下 命令 即 可 。 
D:\JINI2 0> start script\start-browser 
正如 前 面 介绍 过 的 ， 查 找 服务 是 JINI 中 的 一 项 特殊 服务 ， 因 而 此 时 如 果 Reggie 查找 
服务 已 经 正常 启动 了 ， 那 么 可 以 在 Browser 中 查询 到 它 ， 如 图 4-7 所 示 。 为 了 监视 JINI 查 
找 服务 的 运行 状态 ， 可 以 让 Browser 一 直 运 行 下 去 。 


Fle Registrar Options Services Attributes 
roups: <all> 
| registrar, not selected 


Matching Services 


4-7 Browser 查询 界面 


浅 谈 Java 虚拟 机 的 内 部 机 制 


前 面 已 经 讲解 了 整个 Java 技术 的 体系 结构 ， 并 且 也 介绍 了 Java 虚拟 机 在 
Java 技术 体系 中 相对 于 其 他 组 成 部 分 所 扮演 的 角色 。 从 本 章 开 始 ， 将 正式 步 入 


Java 虚拟 机 的 知识 ， 本 章 首先 对 Java 虚拟 机 的 内 部 机 制 进行 概览 性 介绍 ， 为 
读者 学 习 后 面 的 知识 打下 基础 。 
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5.1 什么 是 虚拟 机 


Java 虚拟 机 之 所 以 被 称 之 为 是 “虚拟 ”的 ， 就 是 因为 它 仅 仅 是 由 一 个 规范 来 定义 的 抽 
象 计算 机 。 因 此 ， 要 运行 某 个 Java 程序 ， 首 先 需 要 一 个 符合 该 规范 的 具体 实现 。 本 章 主要 
描述 这 个 规范 本 身 ， 但 是 为 了 更 细致 地 描述 某 些 具 体 特性 ， 我 们 也 将 讨论 它们 可 能 以 哪些 
方式 来 实现 。 本 章 将 详细 讲解 Java 如 何 把 握 网 络 所 带 来 的 巨大 机 遇 ， 为 学 习 本 书后 面 的 知 
识 打下 基础 。 

要 理解 Java 虚拟 机 ， 首 先 必须 意识 到 ， 当 你 说 “Java 虚拟 机 ”时 ， 可 能 指 的 是 以 下 三 
种 不 同 的 东西 : 

口 “ 抽 象 规范 。 

口 一 个 具体 的 实现 

口 一 个 运行 中 的 虚拟 机 实例 。 

Java 虚拟 机 抽象 规范 仅仅 是 个 概念 ， 而 该 规范 的 具体 实现 ， 可 能 来 自 多 个 提供 商 ， 并 
存在 于 多 个 平台 上 。 它 或 者 完全 用 软件 实现 ， 或 者 以 硬件 和 软件 相 结 合 的 方式 来 实现 。 当 
运行 一 个 Java 程序 的 同时 ， 也 就 运行 了 一 个 Java 虚拟 机 实例 。 


5.1.1 JVM 简介 


JVM 全 称 是 Java Virtual Machine， 即 Java 虚拟 机 ， 也 就 是 在 计算 机 上 再 虚拟 一 个 计 
算 机 。JVM 和 我 们 使 用 VMWare 不 一 样 ， 那 个 虚拟 的 东西 是 可 以 看 到 的 ， 这 个 JVM 是 
看 不 到 的 ， 它 存在 内 存 中 。 我 们 知道 计算 机 的 基本 构成 是 运算 器 、 控 制 器 、 存 储 器 、 输 入 
和 输出 设备 ， 而 这 个 JVM 也 有 这 成 套 的 元 素 。 运 算 器 当然 还 是 交 给 硬件 CPU 处 理 了 ， 只 
是 为 了 适应 “一 次 编译 ， 随 处 运行 ”的 情况 ， 需 要 做 一 个 翻译 动作 ， 于 是 就 用 了 JVM 自 
己 的 命令 集 ， 这 与 汇编 的 命令 集 有 点 类 似 ， 每 一 种 汇编 命令 集 针 对 一 个 系列 的 CPU， 比 如 
8086 系列 的 汇编 也 可 以 用 在 8088 上 ， 但 是 就 不 能 跑 在 8051 上 ， 而 JVM 的 命令 集 则 可 
以 到 处 运行 ， 因 为 JVM 做 了 翻译 ， 根 据 不 同 的 CPU， 翻 译 成 不 同 的 机 器 语言 

JVM 中 最 需要 深入 理解 的 就 是 它 的 存储 部 分 ，JVM 是 一 个 内 存 中 的 虚拟 机 ， 那 它 的 
存储 部 分 就 是 内 存 了 ， 我 们 写 的 所 有 类 、 常 量 、 变 量 、 方 法 都 在 内 存 中 ， 这 决定 着 我 们 的 
程序 运行 得 是 否 健壮 、 是 否 高 效 。 


5.1.2” ”JVM 的 组 成 部 分 


JVM 虚拟 机 的 运作 结构 如 图 5-1 所 示 。 
从 图 5-1 中 可 以 看 到 ，JVM 是 运行 在 操作 系统 上 的 ， 它 与 硬件 没有 直接 的 交互 。 我 们 
再 来 看 下 JVM 有 哪些 组 成 部 分 ， 如 图 5-2 所 示 。 
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操作 系统 (如 Windows、Linux 等 ) 


4 | 


硬件 体系 (如 Intel 体 系 、SPAC 等 ) 
5-1 JVM 虚拟 机 的 运作 结构 


Class Files 一 全 


Runtime Data Area 


Stack Heap Method Area 


PC Register Native Method Stack 


Execution Engine | 一 上 Native Interface “| 一 -人 Native Libraies 
5-2 ”JVM 构成 图 
5.2 Java 虚拟 机 的 生命 周期 


一 个 运行 时 的 Java 虚拟 机 实例 的 天 职 是 负责 运行 一 个 Java 程序 。 在 启动 一 个 Java 程 
序 的 同时 会 诞生 一 个 虚拟 机 实例 ， 当 该 程序 退出 时 ， 虚 拟 机 实例 也 随 之 消亡 。 如 果 在 同一 
台 计 算 机 上 同时 运行 三 个 Java 程序 ， 会 得 到 三 个 Java 虚拟 机 实例 。 每 个 Java 程序 都 运行 
于 它 自 己 的 Java 虚拟 机 实例 中 。 

Java 虚拟 机 实例 通过 调用 某 个 初始 类 的 main() 方 法 来 运行 一 个 Java 程序 。 而 这 个 
main() 方 法 必须 是 公有 的 (Publicj)、 静 态 的 (Static) 并 且 返 回 值 为 void， 还 要 接受 一 个 字符 串 
数组 作为 参数 。 任 何 拥有 这 样 一 个 main() 方 法 的 类 都 可 以 作为 Java 程序 运行 的 起 点 。 假 如 
存在 这 样 一 个 Java 程序 ， 此 程序 能 够 打印 出 传 给 它 的 命令 行 参数 : 


package jvm.extl; 
public class Echo { 
public static void main(String[]args) { 


PT RT p> 


Bf darbi 


WS 和 ==3 权衡 优化 、 高 效 和 安全 的 最 优 方案 时 


int length = args.length; 
for (int i = 0; i <length; i++) { 
System.out.print (args[i] +""); 
|; 
System.out .println(); 
} 
上 述 代码 必须 告诉 Java 虚拟 机 要 运行 的 Java 程序 中 初始 类 的 名 字 ， 整 个 程序 将 从 它 

的 main() 方 法 开始 运行 。 现 实 中 一 个 Java 虚拟 机 实现 的 例子 如 SunJava 2 SDK 的 Java 程 
序 。 比 如 ， 如 果 想 要 在 Windows 上 使 用 Java 来 运行 Echo 程序 ， 需 要 输入 如 下 命令 : 


java Echo Greetings, Planet 


该 命令 的 第 一 个 单词 “java”， 告 诉 操作 系统 应 该 运行 来 自 Sun Java 2 SDK 的 Java 虚 
拟 机 。 第 二 个 词 “Echo” 则 支持 初始 类 的 名 字 。Echo 这 个 初始 类 中 必须 有 个 公有 的 、 静 态 
的 方法 main()， 它 获得 一 个 字符 串 数组 参数 并 且 返 回 void。 上 述 命令 行 中 剩 下 的 单词 序列 
“Greeting，Planet” 作 为 该 程序 的 命令 行 参数 以 字符 串 数组 的 形式 传递 给 main()， 因 此 ， 
对 于 上 面 这 个 例子 ， 传 递 给 类 Echo 中 main0 方 法 的 字符 串 数组 参数 的 内 容 就 是 : 

args[0] 为 "Greeting," 

args[1] 为 "Planet." 

Java 程序 初始 类 中 的 main() 方 法 ， 将 作为 该 程序 初始 线程 的 起 点 ， 任 何其 他 的 线程 都 
是 由 这 个 初始 线程 启动 的 。 

在 Java 虚拟 机 内 部 有 两 种 线程 : 守护 线程 与 非 守 护 线程 。 守 护 线程 通常 是 由 虚拟 机 自 
己 使 用 的 ， 比 如 执行 垃圾 收集 任务 的 线程 。 但 是 ，Java 程序 也 可 以 把 它 创建 的 任何 线程 标 
记 为 守护 线程 。 而 Java 程序 中 的 初始 线程 一 一 就 是 开始 与 main() 的 那个 ， 就 是 非 守 护 线程 。 

只 要 还 有 任何 非 守护 线程 在 运行 ， 那 么 这 个 Java 程序 也 在 继续 运行 (虚拟 机 仍然 存 
活 )。 当 该 程序 中 所 有 的 非 守 护 线程 都 终止 时 ， 虚 拟 机 实例 将 自动 退出 。 假 若 安全 管理 器 允 
许 ， 程 序 本 身 也 能 够 通过 调用 Runtime 类 或 者 System 类 的 exit 方法 来 退出 。 

在 上 面 的 Echo 程序 中 ， 方 法 main0 〇 并 没有 调用 其 他 的 线程 。 所 以 当 它 打印 完 命令 行 
参数 后 返回 main() 方 法 。 这 就 终止 了 该 程序 中 唯一 的 非 守 护 线程 ， 最 终 导致 虚拟 机 实例 
退出 。 


5.3 ”Java 虚拟 机 的 体系 结构 


在 Java 虚拟 机 规范 中 ， 一 个 虚拟 机 实例 的 行为 是 分 别 按照 子 系统 、 内 存 区 、 数 据 类 型 
以 及 指令 这 几 个 术语 来 描述 的 。 这 些 组 成 部 分 一 起 展示 了 抽象 的 虚拟 机 的 内 部 抽象 体系 结 
构 。 但 是 规范 中 对 它们 的 定义 并 非 要 强制 规定 Java 虚拟 机 实现 内 部 的 体系 结构 ， 更 多 的 是 
为 了 严格 地 定义 这 些 实现 的 外 部 特征 。 规 范本 身 通过 定义 这 些 抽象 的 组 成 部 分 以 及 它们 之 
间 的 交互 ， 来 定义 任何 Java 虚拟 机 实现 都 必须 遵守 的 行为 。 
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图 5-3 是 Java 虚拟 机 的 结构 图 ， 包括 在 规范 中 描述 的 主要 子 系统 和 内 存 区 。 第 4 章 我 
们 曾 提 到 ， 每 个 Java 虚拟 机 都 有 一 个 类 装载 器 子 系统 ， 它 根据 给 定 的 全 限定 名 类 装 入 类 型 
(类 或 接口 )， 同 样 ， 每 个 Java 虚拟 机 都 有 一 个 执行 引擎 ， 它 负责 执行 那些 包含 在 被 装载 类 


的 方法 中 的 指令 。 
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当 Java 虚拟 机 运行 一 个 程序 时 ， 它 需要 使 用 内 存 来 存储 许多 东西 ， 例 如 下 面 的 元 素 。 
字 节 码 。 

从 已 装载 的 class 文件 中 得 到 的 其 他 信息 。 

程序 创建 的 对 象 。 

传递 给 方法 的 参数 。 

返回 值 。 

局 部 变量 。 

运算 的 中 间 结 果 。 

Java 虚拟 机 会 把 上 述 元 素 都 组 织 到 几 个 “运行 时 数据 区 ”中 ， 目 的 是 便于 管理 。 尽 管 
这 些 “ 运 行 时 数据 区 ”都 会 以 某 种 形式 存在 于 每 一 个 Java 虚拟 机 实现 中 ， 但 是 规范 对 它们 
的 描述 却 是 相当 抽象 的 。 这 些 运 行 时 数据 区 结构 上 的 细节 ， 大 多 数 都 由 具体 实现 的 设计 者 
决定 。 

不 同 的 虚拟 机 实现 可 能 具有 很 不 同 的 内 存 限 制 ， 有 的 实现 可 能 有 大 量 的 内 存 可 用 ， 有 
的 可 能 只 有 很 少 。 有 的 实现 可 以 利用 虚拟 内 存 ， 有 的 则 不 能 。 规 范本 身 对 “运行 时 数据 
区 ”只 有 抽象 的 描述 ， 这 就 使 得 Java 虚拟 机 可 以 很 容易 地 在 各 种 计算 机 和 设备 上 实现 。 
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某 些 运行 时 数据 区 是 由 程序 汇总 所 有 线程 共享 的 ， 还 有 一 些 则 只 由 一 个 线程 拥有 。 每 

个 Java eae 它们 是 由 该 虚拟 机 实例 中 所 有 线程 共享 

的 。 当 虚拟 机 装载 一 个 class 文件 时 ， 它 会 从 这 个 class 文件 包含 的 二 进 制 数 据 中 解析 类 型 

息 。 然 后 ， 它 把 这 些 类 型 信 息 放 到 方法 区 中 。 当 程 序 运行 时 ， 虚 拟 机 会 把 所 有 该 程序 在 
运行 时 创建 的 对 象 都 放 到 堆 中 。 请 看 图 5-4 中 对 这 些 内 存 区 域 的 描绘 。 


5-4 ”由 所 有 线程 共享 的 运行 时 数据 区 


当 每 一 个 新 线程 被 创建 时 ， 它 都 将 得 到 它 自己 的 PC 寄存 器 (程序 计数 器 ) 以 及 一 个 Java 
栈 : 如 果 线 程 正在 执行 的 是 一 个 Java 方法 ( 非 本 地 方法 )， 那 么 PC 寄存 器 的 值 将 总 是 指示 
下 一 条 将 被 执行 的 指令 ， 而 它 的 Java 栈 则 总 是 存储 该 线程 中 Java 方法 调用 的 状态 一 一 包 
括 它 的 局 部 变量 ， 被 调用 时 传 进来 的 参数 ， 它 的 返回 值 ， 以 及 运算 的 中 间 结 果 等 等 。 而 本 
地 方法 调用 的 状态 ， 则 是 以 某 种 依赖 于 具体 实现 的 方式 存储 在 本 地 方法 栈 中 ， 也 可 能 是 在 
寄存 器 或 者 其 他 某 些 与 特定 实现 相关 的 内 存 区 中 。 

Java 栈 是 由 许多 栈 帧 (Stackframe) 或 者 说 帧 (Frame) 组 成 的 ， 一 个 栈 帧 包含 一 个 Java 方 
法 调用 的 状态 。 当 线程 调用 一 个 Java 方法 时 ， 虚 拟 机 压 入 一 个 新 的 栈 帧 到 该 线程 的 Java 
栈 中 : 当 该 方法 返回 时 ， 这 个 栈 帧 被 从 Java 栈 中 弹出 并 抛弃 。 

Java 虚拟 机 没有 寄存 器 ， 其 指令 集 使 用 Java 栈 来 存储 中 间 数 据 。 这 样 设计 的 原因 是 为 
了 保持 Java 虚拟 机 的 指令 集 尽量 紧凑 ， 同 时 也 便于 Java 虚拟 机 在 那些 只 有 很 少 通用 寄存 
器 的 平台 上 实现 ， 另 外 Java 虚拟 机 的 这 种 基于 栈 的 体系 结构 ， 也 有 助 于 运行 时 某 些 虚拟 机 
实现 的 动态 编译 器 和 即时 编译 器 的 代码 优化 。 

图 5-5 描绘 了 Java 虚拟 机 为 每 一 个 线程 创建 的 内 存 区 ， 这 些 内 存 区 域 是 私有 的 ， 任 何 
线程 都 不 能 访问 另 一 个 线程 的 PC 寄存 器 或 者 Java 栈 。 

5-5 展示 了 一 个 虚拟 机 实例 的 快照 ， 它 有 三 个 线程 正在 执行 。 线 程 1 和 线程 2 都 正 
在 执行 Java 方法 ， 而 线程 3 则 正在 执行 一 个 本 地 方法 。 在 图 5-5 中 ， 和 本 书 其 他 地 方 一 
样 ，Java 栈 都 是 向 下 生长 的 ， 而 栈 顶 都 显示 在 图 的 底部 ， 当 前 正在 执行 的 方法 的 栈 帧 则 以 
浅 色 表示 ， 对 于 一 个 正在 运行 Java 方法 的 线程 而 言 ， 它 的 PC 寄存 器 总 是 指向 下 一 条 将 被 
执行 的 指令 。 在 图 5-5 中 ， 像 这 样 的 PC 寄存 器 (比如 线程 1 和 线程 2 的 ) 都 是 以 浅 色 显示 
的 。 由 于 线程 3 当前 正在 执行 一 个 本 地 方法 ， 因 此 ， 它 的 PC 寄存 器 一 一 以 深 色 显 示 的 那 
个 ， 其 值 是 不 确定 的 。 


人 
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线程 1 线程 1 线程 2 线程 3 线程 3 


栈 帧 | | 楼 帧 | | 材 由 
线程 2 a 1 
栈 帧 | 『「 栈 巾 | 栈 巾 
线程 3 
[| Se 
本 地 方法 栈 
PC 寄存 器 栈 帧 | jaw 并 
图 5.5 线程 专 有 的 运行 时 数据 区 
5.3.1 数据 类 型 


Java 虚拟 机 是 通过 某 些 数 据 类 型 来 执行 计算 的 ， 数 据 类 型 及 其 运算 都 是 由 Java 虚拟 机 
规范 严格 定义 的 ， 数 据 类 型 可 以 分 为 两 种 : 基本 类 型 和 引用 类 型 。 基 本 类 型 的 变量 持 有 原 
始 值 。 而 引用 类 型 的 变量 持 有 引用 值 。 术 语 “ 引 用 值 ” 指 的 是 对 某 个 对 象 的 引用 ， 而 不 是 
该 对 象 本 身 ， 与 此 相对 ， 原 始 值 则 是 真正 的 原始 数据 。 请 看 图 5-6 中 对 Java 虚拟 机 中 数据 
类 型 的 描绘 。 


引用 类 型 FE) 引用 接口 类 型 


数组 类 型 


图 5-6 ”Java 虚拟 机 中 的 数据 类 型 
Java 语言 中 的 所 有 基本 类 型 也 都 是 Java 虚拟 机 中 的 基本 类 型 。 但 是 boolean 有 点 特 
别 ， 虽 然 Java 虚拟 机 也 把 boolean 看 作 是 基本 类 型 ， 但 是 指令 集 对 boolean 只 提供 有 限 的 
支持 。 当 编译 器 把 Java 源码 编译 为 字 节 码 时 ， 它 会 用 int 或 byte 来 表示 boolean。 在 Java 
虚拟 机 中 ，false 是 由 整数 0 来 表示 的 ， 所 有 非 0 整数 都 表示 true， 设 计 boolean 值 的 操作 


PT PR OT RO NO p> 


fi ava 


~ 三 


则 会 使 用 int。 另 外 ，boolean 数组 是 当 作 byte 数组 来 访问 的 ， 但 是 在 “ 堆 ” 区 ， 它 也 可 以 
被 标识 为 位 域 。 

除了 boolean 类 型 以 外 ，Java 语言 中 的 基本 类 型 构成 了 Java 虚拟 机 中 的 数值 类 型 。 虚 
拟 机 中 的 数值 类 型 分 为 两 种 : 整数 类 型 (包括 byte、short、int、long、chan 和 浮 点 数 类 型 
(包括 float 和 double) 和 Java 语言 一 样 ，Java 虚拟 机 的 基本 类 型 的 值 域 在 任何 地 方 都 是 一 致 
的 ， 比 如 ， 不 管 底层 的 主机 平台 是 什么 ， 一 个 long 在 任何 虚拟 机 中 总 是 一 个 64 位 二 进 制 
补 码 表 示 的 有 符号 整数 。 

Java 虚拟 机 中 还 有 一 个 只 在 内 部 使 用 的 基本 类 型 : retumAdress，Java 程序 员 不 能 使 用 
这 个 类 型 ， 这 个 基本 类 型 被 用 来 实现 Java 程序 中 的 finally 子 句 。 

Java 虚拟 机 的 引用 类 型 被 统称 为 “引用 ”(reference)， 主 要 有 如 下 三 种 引用 类 型 。 

口 类 类 型 ， 类 类 型 的 值 是 对 类 实例 的 引用 。 

口 ”接口 类 型 接口 类 型 的 值 ， 则 是 对 实现 了 该 接口 的 某 个 类 实例 的 引用 。 

口 “数组 类 型 : 数组 类 型 的 值 是 对 数组 对 象 的 引用 ， 在 Java 虚拟 机 中 ， 数 组 是 一 个 真 

正 的 对 象 。 

上 述 三 种 类 型 的 值 都 是 对 动态 创建 对 象 的 引用 。 除 此 之 外 ，Java 虚拟 机 还 有 一 种 特殊 
的 引用 值 null， 它 表示 该 引用 变量 没有 引用 任何 对 象 。 

Java 虚拟 机 规范 定义 了 每 一 种 数据 类 型 的 取 值 范围 ， 但 是 却 没有 定义 它们 的 位 宽 。 存 
储 这 些 类 型 的 值 所 需 的 占 位 宽度 ， 是 由 具体 的 虚拟 机 实现 的 设计 者 决定 的 。 关 于 Java 虚拟 
机 数据 类 型 的 取 值 范围 ， 具 体 说 明 如 下 。 


1， 整形 类 型 和 整 型 值 的 取 值 范围 


整形 类 型 和 整 型 值 的 取 值 范围 如 下 : 

口 “byte 类 型 ， 取 值 范围 是 从 -128 一 127(-27 一 27-1)， 包 括 -128 和 127。 

口 ”short 类型， 取 值 范围 是 -32768 一 32767(-215 一 215-1)， 包 括 -32768 和 32767。 

口 int 类 型 : 取 值 范围 是 -2147483648 ~ 2147483647(-231 ~ 231-1) ， 包 括 
-2147483648 和 2147483647。 

口 long 类 型 : 取 值 范围 是 -9223372036854775808 一 9223372036854775807(-263 至 
263-1)， 包 括 -9223372036854775808 和 9223372036854775807。 

口 char 类 型 取 值 范围 是 0~65535， 包 括 0 和 65535。 


2. 浮 点 类 型 、 取 值 集合 和 浮 点 值 


浮 点 类 型 包含 32 位 单 精度 的 float 类 型 和 64 位 双 精 度 的 double 类 型 两 种 ， 浮 点 数 除 
了 包括 正 负 带 符号 可 数 的 数值 ， 还 包括 了 正 负 零 、 正 负 无 穷 大 和 一 个 特殊 的 “ 非 数 字 ” 标 
识 (Not-a-Number， 下 文 用 NaN 表示 )。NaN 值 用 于 表示 某 些 无 效 的 运算 操作 ， 例 如 除数 为 
零 等 情况 。 

所 有 Java 虚拟 机 的 实现 都 必须 支持 两 种 标准 的 浮 点 数值 集合 ， 单 精度 浮 点 数 集合 和 双 
精度 浮 点 数 集合 。 


权衡 优化 、 高 效 和 安全 的 最 优 方 案 
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3. returnAddress 类 型 和 值 


returnAddress 类 型 会 被 Java 虚拟 机 的 jsr、ret 和 jsr_w 指令 所 使 用 。returmnAddress 类 型 
的 值 指向 一 条 虚拟 机 指令 的 操作 码 。 与 前 面 介 绍 的 那些 数值 类 的 原始 类 型 不 同 ， 
retumAddress 类 型 在 Java 语言 之 中 并 不 存在 相应 的 类 型 ， 也 无 法 在 程序 运行 期 间 更 改 
retumAddress 类 型 的 值 。 


4. boolean 类 型 


Java 虚拟 机 不 提供 操作 boolean 类 型 的 字 节 码 指令 ， 程 序 在 编译 后 boolean 类 型 都 转化 
成 了 int 操作 。 但 是 Java 虚拟 机 支持 boolean 类 型 的 数组 的 访问 和 修改 ， 共 用 byte 类 型 数 
组 的 字 节 码 指令 。 


5.3.2 “ 字 ” 


在 Java 虚拟 机 中 ， 最 基本 的 数据 单元 就 是 字 (Word)， 它 的 大 小 是 由 每 个 虚拟 机 实现 的 
设计 者 来 决定 的 。 字 长 必须 足够 大 ， 至 少 是 一 个 字 单 元 就 足以 持 有 byte、short、int、 
char、float、returnAddress 或 者 reference 类 型 的 值 ， 而 两 个 字 单 元 就 足以 持 有 long 或 者 
double 类 型 的 值 。 因 此 ， 虚 拟 机 实现 的 设计 者 至 少 得 选择 32 位 作为 字 长 ， 或 者 选择 更 为 
高 效 的 字 长 大 小 。 通 常 根据 底层 主机 平台 的 指针 长 度 来 选择 字 长 。 

在 Java 虚拟 机 规范 中 ， 关 于 运行 时 数据 区 的 大 部 分 内 容 ， 都 是 基于 “ 字 ” 这 个 抽象 概 
念 的 。 比 如 ， 关 于 栈 帧 的 两 个 部 分 一 一 局 部 变量 和 操作 数 栈 一 一 都 是 按照 “ 字 ” 来 定义 
的 。 这 些 内 存 区 与 能 够 容纳 任何 虚拟 机 数据 类 型 的 值 ， 当 把 这 些 值 放 到 局 部 变量 或 者 操作 
数 栈 中 时 ， 它 将 占用 一 个 或 两 个 字 单 元 。 

在 运行 时 ，Java 程序 无 法 侦 测 到 底层 虚拟 机 的 字 长 大 小 。 同 样 虚拟 机 的 字 长 大 小 也 不 
会 影响 程序 的 行为 一 一 它 仅仅 是 虚拟 机 实现 的 内 部 属性 。 


5.3.3 ”类 装载 器 子 系统 


在 Java 虚拟 机 中 ， 负 责 查找 并 装载 类 型 的 那 部 分 被 称 为 类 装载 器 子 系统 。Java 虚拟 机 
有 两 种 类 装载 器 : 启动 类 装载 器 和 用 户 自 定 义 类 装载 器 。 其 中 前 者 是 Java 虚拟 机 实现 的 一 
部 分 ， 后 者 则 是 Java 程序 的 一 部 分 。 由 不 同 的 类 装载 器 装载 的 类 将 被 放 在 虚拟 机 内 部 的 不 
同 命名 空间 中 。 

类 装载 器 子 系统 设计 Java 虚拟 机 的 其 他 几 个 组 成 部 分 ， 以 及 几 个 来 自 Java。Lang 库 
的 类 。 比 如 用 户 自 定义 的 类 装载 器 是 普通 的 Java 对 象 ， 它 的 类 必须 派生 自 
java.lang.ClassLoader 类 。ClassLoader 中 定义 的 方法 为 程序 提供 了 访问 类 装载 器 机 制 的 接 
口 。 此 外 ， 对 于 每 一 个 被 装载 的 类 型 ，Java 虚拟 机 都 会 为 它 创建 一 个 java.Lang.Class 类 的 
实力 来 代表 该 类 型 。 和 所 有 其 他 对 象 一 样 ， 用 户 自 定义 类 装载 器 以 及 Class 类 的 实例 都 放 
在 内 存 区 中 的 堆 中 ， 而 装载 的 类 型 信息 则 都 位 于 方法 区 。 

装载 、 连 接 和 初始 化 类 装载 器 子 系统 除了 要 定位 和 导入 二 进 制 class 文件 外 ， 还 必须 
负责 验证 被 导入 类 的 正确 性 ， 为 类 变量 分 配 并 初始 化 内 存 ， 以 及 帮助 解析 符号 引用 。 这 些 
动作 必须 严格 按照 以 下 顺序 进行 : 


PT RR b> 


ada 志 拉 机 开发 


ES 


(1) 装载 : 查找 并 装载 类 型 的 二 进 制 数据 。 

(2) 连接 : 执行 验证 、 准 备 ， 以 及 解析 (可 选 )。 

口 “ 验 证 : 确保 被 导入 类 型 的 正确 性 。 

口 准备， 为 类 变量 分 配 内 存 ， 并 将 其 初始 化 为 默认 值 。 

口 ”解析 : 把 类 型 中 的 符号 引用 转换 为 直接 引用 。 

(3) 初始 化 : 把 类 变量 初始 化 为 正确 初始 值 。 

(4) 启动 类 装载 器 。 

只 要 是 符合 Java class 文件 格式 的 二 进 制 文件 ，Java 虚拟 机 实现 都 必须 能 够 从 中 辨别 
并 装载 其 中 的 类 和 接口 。 某 些 虚 拟 机 实现 也 可 以 识别 其 他 非 规范 的 二 进 制 格式 文件 ， 但 它 
必须 能 够 辨别 class 文件 。 

每 个 Java 虚拟 机 实现 都 必须 有 一 个 启动 类 装载 器 ， 它 知道 怎么 装载 受信 任 的 类 ， 比 如 
JavaAPI 的 class 文件 。Java 虚拟 机 规范 并 未 规定 启动 类 装载 器 如 何 去 寻 找 class 文件 ， 这 
又 是 一 件 保留 给 具体 的 实现 设计 者 去 决定 的 事情 。 

只 要 给 定 某 个 类 型 的 全 限定 名 ， 启 动 类 装载 器 就 必须 能 够 以 某 种 方式 得 到 定义 该 类 型 
的 数据 。 例 如 JDK 1.1 会 首先 逐个 搜索 用 户 在 CLASSPATH 环境 变量 中 定义 的 目录 ， 直 到 
找到 一 个 名 为 “该 类 型 名 +.class ”的 文件 为 止 。 除 非 该 类 型 属于 某 个 未 命名 的 包 ， 否 则 启 
动 类 装载 器 会 在 CLASSPATH 包含 的 目录 下 的 子 目 录 中 寻找 这 样 一 个 文件 ， 这 些 子 目录 的 
路 径 名 是 根据 类 型 的 包 名 称 构建 的 。 比 如 ， 如 果 启 动 类 装载 器 正在 搜索 这 样 一 个 类 
java.lang.Object， 那 么 它 将 在 每 一 个 CLASSPATH 包含 的 目录 下 ， 查 找 类 似 java\lang 的 一 
个 子 目 录 ， 以 及 其 中 的 Object.class 文件 。 

而 在 JDK 的 后 期 版 本 中 ， 启 动 类 装载 器 将 只 在 系统 类 的 安装 路 径 中 查找 要 装 入 的 类 : 
而 搜索 CLASSPATH 的 任务 ， 现 在 交 给 了 系统 类 装载 器 一 一 它 是 一 个 自 定义 的 类 装载 器 ， 
当 虚 拟 机 启动 时 就 被 自动 创建 了 。 

(5) 用 户 自 定义 类 装载 器 。 

尽管 “用 户 自 定义 类 装载 器 ”本 身 是 Java 程序 的 一 部 分 ， 但 类 ClassLoader 中 的 4 个 
方法 是 通 往 Java 虚拟 机 的 通道 : 

protected final Class<?> defineClass (String name, byte[] b, int off, int 

i final Class<?> defineClass (String name, byte[] b, int off, int 

len, ProtectionDomain protectionDomain); 


protected final Class<?> findsystemClass (String name); 
protected final void resolveClass (Class<?> c); 


任何 Java 虚拟 机 实现 都 必须 把 这 些 方法 连接 到 内 部 的 类 装载 器 子 系统 中 。 

两 个 被 重 载 的 defineCalss0 方 法 都 要 接受 一 个 名 为 data[] 的 字 节 数组 作为 输入 参数 ， 并 
且 在 data[offset] 到 data[offsettlength] 之 间 的 二 进 制 数据 必须 符合 Javaclass 文件 格式 一 一 它 
表示 一 个 新 的 可 用 类 型 。 而 name 参数 是 个 字符 串 ， 它 支持 该 类 型 的 全 限定 名 。 当 使 用 第 
一 个 defineClass0 时 ， 该 类 型 将 被 赋予 默认 的 保护 域 。 使 用 第 二 个 definClass0 时 ， 该 类 型 
的 保护 域 将 由 它 的 protectionDomain 参数 指定 。 每 个 Java 虚拟 机 实现 都 必须 保证 
ClassLoader 类 的 defineClass() 方 法 能 够 把 新 类 型 导入 到 方法 区 中 。 
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方法 findSystemClass() 接 受 一 个 字符 串 作 为 参数 ， 它 支持 将 被 装 入 类 型 的 全 限定 名 。 
在 1.0 版 本 和 1.1 版 本 中 ， 此 方法 会 通过 启动 类 装载 器 类 装载 指定 类 型 。 如 果 启 动 类 装载 
器 装载 完成 ， 它 会 返回 对 Class 对 象 (该 对 象 描述 了 该 类 型 ) 的 引用 。 如 果 没 有 找到 相应 的 
class 文件 ， 它 会 抛 出 ClassNotFoundException 异常 。 而 在 后 面 的 版 本 中 ， 方 法 
findSystemClass() 使 用 系统 类 装载 器 来 装载 指定 类 型 。 任 何 Java 虚拟 机 实现 都 必须 保证 方 
法 findSystemClass() 能 够 以 这 种 方式 调用 启动 类 装载 器 或 者 系统 类 装载 器 。 

方法 resolverClass() 接 受 一 个 Class 实例 的 引用 作为 参数 ， 它 将 对 该 Class 实例 表示 的 
类 型 执行 连接 动作 。 而 方法 defineClass0 则 只 负责 装载 。 当 方法 defineClass0 返 回 一 个 
Class 实例 时 ， 也 就 表示 指定 的 class 文件 已 经 被 找到 并 装载 到 方法 区 了 ， 但 是 却 不 一 定 被 
连接 和 初始 化 。Java 虚拟 机 实现 必须 保证 CLassLoader 类 的 resolveClass() 方 法 能 够 让 类 装 
载 器 子 系统 执行 连接 动作 。 

(6) 命名 空间 。 

每 个 类 装载 器 都 有 自己 的 命名 空间 ， 其 中 维护 着 由 它 装载 到 额 的 类 型 。 所 以 一 个 Java 
程序 可 以 多 次 装载 具有 同一 个 全 限定 名 的 多 个 类 型 。 这 样 一 个 类 型 的 全 限定 名 就 不 足以 确 
定 在 一 个 Java 虚拟 机 中 的 唯一 性 。 因 此 ， 当 多 个 类 装载 器 装载 了 同名 的 类 型 时 ， 为 了 唯一 
地 标识 该 类 型 ， 还 要 在 类 型 名 称 前 加 上 装载 该 类 型 的 类 装载 器 的 标识 。 

Java 虚拟 机 中 的 命名 空间 ， 其 实 是 解析 过 程 的 结果 。 对 于 每 一 个 被 装载 的 类 型 ，Java 
虚拟 机 都 会 记录 装载 它 的 类 装载 器 。 当 虚拟 机 解析 一 个 类 到 另 一 个 类 的 符号 引用 时 ， 它 需 
要 被 引用 类 的 类 装载 器 。 


5.3.4 方法 区 


在 Java 虚拟 机 中 ， 关 于 被 装载 类 型 的 信息 存储 在 一 个 逻辑 上 被 称 为 方法 区 的 内 存 中 ， 
当 虚 拟 机 装载 某 个 类 型 时 ， 它 使 用 类 装载 器 定位 相应 的 class 文件 ， 然 后 读 入 这 个 class 文 
件 (一 个 线性 二 进 制 数据 流 )， 然 后 将 它 传输 到 虚拟 机 中 。 紧 接着 虚拟 机 提取 其 中 的 类 型 信 
息 ， 并 将 这 些 信息 存储 到 方法 区 。 该 类 型 中 的 类 变量 同样 也 存储 在 方法 区 中 。 

Java 虚拟 机 在 内 部 如 何 存 储 类 型 信息 ， 这 是 由 具体 实现 的 设计 者 来 决定 的 。 例 如 在 
class 文件 中 ， 多 字 节 值 总 是 以 高 位 在 前 的 顺序 存储 。 但 是 当 这 些 数据 引入 到 方法 区 后 ， 虚 
拟 机 可 以 以 任何 方式 存储 它 。 假 设 某 个 实现 是 运行 在 低位 优先 的 处 理 器 上 ， 那 么 它 很 可 能 
会 把 多 字 节 值 以 低位 优先 的 顺序 存储 到 方法 区 中 。 

当 虚 拟 机 运行 Java 程序 时 ， 它 会 查找 使 用 存储 在 方法 区 中 的 类 型 信息 。 设 计 者 应 当 为 
类 型 信息 的 内 部 表示 设计 恰当 的 数据 结构 ， 以 尽 可 能 在 保持 虚拟 机 小 巧 紧凑 的 同时 加 快 程 
序 的 运行 效率 。 如 果 正 在 设计 一 个 需要 在 少量 内 存 的 限制 中 操作 的 实现 ， 设 计 者 可 能 会 决 
定 以 牺牲 某 些 运行 速度 来 换取 紧凑 性 。 另 外 一 个 方面 ， 如 果 设 计 一 个 将 在 虚拟 内 存 系统 中 
运行 的 实现 ， 设 计 者 可 能 会 决定 在 方法 区 中 保存 一 些 元 余 信 息 ， 以 加 快 执行 速度 。 如 果 底 
层 主机 没有 提供 虚拟 内 存 ， 但 是 提供 了 一 个 硬盘 ， 设 计 者 可 能 会 在 实现 中 创建 一 个 虚拟 内 
存 系统 。 此 时 Java 程序 员 可 以 根据 目标 平台 的 资源 限制 和 需求 ， 在 空间 和 时 间 上 做 出 权 
衡 ， 选 择 实现 什么 样 的 数据 结果 和 数据 组 织 。 

由 于 所 有 线程 都 共享 方法 区 ， 因 此 它们 对 方法 区 数据 的 访问 必须 被 设计 为 是 线程 安全 
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的 。 比 如 ， 假 设 同 时 有 两 个 线程 都 企图 访问 一 个 名 为 EXAM 的 类 ， 而 这 个 类 还 没有 被 装 
入 虚拟 机 ， 那 么 ， 这 时 只 应 该 有 一 个 线程 去 装载 它 ， 而 另 一 个 线程 则 只 能 等 待 。 

方法 区 的 大 小 不 必 是 固定 的 ， 虚 拟 机 可 以 根据 应 用 的 需要 动态 调整 。 同 样 ， 方 法 区 也 
不 必 是 连续 的 ， 方 法 区 可 以 在 一 个 堆 中 自由 分 配 。 另 外 ， 虚 拟 机 也 可 以 允许 用 户 或 者 程序 
员 指 定 方法 区 的 初始 大 小 以 及 最 小 和 最 大 尺寸 等 。 

方法 区 也 可 以 被 垃圾 收集 ， 因 为 虚拟 机 人 允许 通过 用 户 定义 的 类 装载 器 来 动态 扩展 Java 
程序 ， 因 此 一 些 类 也 会 成 为 程序 “不 再 引用 ”的 类 。 当 某 个 类 变 为 不 再 被 引用 的 类 时 ， 
Java 虚拟 机 可 以 卸载 这 个 类 (垃圾 收集 )， 从 而 使 方法 区 占据 的 内 存 保持 最 小 。 类 的 印 载 以 
及 一 个 类 变 为 “不 再 被 引用 ”的 必需 条 件 。 

口 “” 类 型 信息 : 对 每 个 装载 的 类 型 ， 虚 拟 机 都 会 在 方法 区 中 存储 以 下 类 型 信息 : 

这 个 类 型 的 全 限定 名 。 

这 个 类 型 的 直接 超 类 的 全 限定 名 (除非 这 个 类 是 java.lang.Object， 它 没有 超 类 )。 
这 个 类 型 是 类 类 型 还 是 接口 类 型 。 

这 个 类 型 的 访问 修饰 符 (public、abstract 或 final 的 某 个 子 集 )。 

口 ” 任 何 直 接 超 接口 的 全 限定 名 的 有 序列 表 。 

在 Java class 文件 和 虚拟 机 中 ， 类 型 名 总 是 以 全 限定 名 出 现 。 在 Java 源 代码 中 ， 全 限 
定名 由 类 所 属 包 的 名 称 加 一 个 “.”， 再 加 上 类 名 组 成 。 例 如 ， 类 Object 的 所 属 包 为 
java.lang， 那 么 它 的 全 限定 名 应 该 是 java.lang.Object， 但 在 class 文件 里 ， 所 有 的 “.” 都 被 
斜 杠 “/” 代 蔡 ， 这 样 就 成 为 java/lang/Object。 至 于 全 限定 名 在 方法 区 中 的 表示 ， 则 因 不 同 
的 设计 者 有 不 同 的 选择 而 不 同 ， 可 以 用 任何 形式 和 数据 结构 来 表示 。 

除了 上 面 列 出 的 基本 类 型 信息 外 ， 虚 拟 机 还 得 为 每 个 被 装载 的 类 型 存储 以 下 信息 : 

口 “ 该 类 型 的 常量 池 。 
字段 信息 。 
方法 信息 。 
除了 常量 意外 的 所 有 类 (静态 ) 变 量 。 

一 个 到 类 CLassLoader 的 引用 。 

口 一 个 到 Class 类 的 引用 。 

在 接 下 来 的 内 容 中 ， 将 简要 介绍 上 述 数 据 类 型 。 

1) 常量 池 

虚拟 机 必须 为 每 个 被 装载 的 类 型 维护 一 个 常量 池 。 常 量 池 就 是 该 类 型 所 用 常量 的 一 个 
有 序 集合 ， 包 括 直接 常量 (Stringinteger 和 floatingpoint 常量 ) 和 对 其 他 类 型 、 字 段 和 方法 的 
符号 引用 。 池 中 的 数据 项 就 像 数组 一 样 是 通过 索引 访问 的 。 因 为 常量 池 存储 了 相应 类 型 所 
用 到 的 所 有 类 型 、 字 段 和 方法 的 符号 引用 ， 所 以 它 在 Java 程序 的 动态 连接 中 起 着 核心 
作用 。 

字段 信息 : 对 于 类 型 中 生命 的 每 一 个 字段 ， 方 法 区 中 必须 保存 下 面 的 信息 。 除 此 之 
外 ， 这 些 字段 在 类 或 者 接口 中 的 生命 顺序 也 必须 保存 。 下 面 是 字段 信息 的 清单 : 

口 ”字段 名 

口 ”字段 的 类 型 


OOOO 


[| 
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口 “ 字 段 的 修饰 符 (publicprivate,protected,static.finalvolatile,transient 的 某 个 子 集 ) 

2) 方法 信息 

对 于 类 型 中 声明 的 每 一 个 方法 ， 方 法 区 中 必须 保存 下 面 的 信息 。 和 字段 一 样 ， 这 些 方 
法 在 类 或 者 接口 中 的 生命 顺序 也 必须 保存 。 下 面 是 方法 信息 的 清单 : 

口 方法 名 

口 方法 的 返回 类 型 (或 void) 

口 方法 参数 的 数量 和 类 型 ( 按 声明 顺序 ) 


口 方法 的 修饰 符 
除 上 面 的 清单 中 列 出 的 条 目 之 外 ， 如 果菜 个 方法 不 是 抽象 的 和 本 地 的 ， 它 还 必须 保存 
下 列 信息 : 


口 方法 的 字 节 码 (bytecodes) 

口 ”操作 数 栈 和 该 方法 的 栈 帧 中 的 局 部 变量 区 的 大 小 

口 ”异常 表 

类 (静态 ) 变 量 是 由 所 有 类 实例 共享 的 ， 但 是 即使 没有 任何 类 实例 ， 它 也 可 以 被 访问 。 
这 些 变 量 只 与 类 有 关 一 一 而 非 类 的 实例 ， 因 此 它们 总 是 作为 类 型 信息 的 一 部 分 而 存储 在 方 
法 区 。 除 了 在 类 中 生命 的 编译 时 常量 外 ， 虚 拟 机 在 使 用 某 个 类 之 前 ， 必 须 在 方法 区 中 为 这 
些 类 分 配 空间 。 

而 编译 时 常量 (就 是 那些 用 final 声明 以 及 用 编译 时 已 知 的 值 初始 化 的 类 变量 ) 则 和 一 般 
的 类 变量 的 处 理 方式 不 同 ， 每 个 使 用 编译 时 常量 的 类 型 都 会 复制 它 的 所 有 常量 到 自己 的 常 
量 池 中 ， 或 嵌入 到 它 的 字 节 码 流 中 。 作 为 常量 池 或 字 节 码 流 的 一 部 分 ， 编 译 时 常量 保存 在 
方法 区 中 一 一 就 和 一 般 的 类 变量 一 样 。 但 是 当 一 般 的 类 变量 作为 声明 它们 的 类 型 的 一 部 分 
数据 而 保存 的 时 候 ， 编 译 时 常量 作为 使 用 它们 的 类 型 的 一 部 分 而 保存 。 

指向 ClassLoader 类 的 引用 每 个 类 型 被 装载 的 时 候 ， 虚 拟 机 必须 跟踪 它 是 由 启动 类 装 
载 器 还 是 由 用 户 自 定义 类 装载 器 装载 的 。 如 果 是 用 户 自 定义 类 装载 器 装载 的 ， 那 么 虚拟 机 
必须 在 类 型 信息 中 存储 对 该 类 装载 器 的 引用 。 这 是 作为 方法 表 中 的 类 型 数据 的 一 部 分 保 
存 的 。 

虚拟 机 会 在 动态 连接 期 间 使 用 这 个 信息 。 当 某 个 类 型 引用 另 一 个 类 型 的 时 候 ， 虚 拟 机 
会 请 求 装载 发 起 引用 类 型 的 类 装载 器 来 装载 被 引用 的 类 型 。 这 个 动态 连接 的 过 程 ， 对 于 虚 
拟 机 分 离 命 名 空间 的 方式 也 是 至 关 重 要 的 。 为 了 能 够 正确 地 执行 动态 连接 以 及 维护 多 个 命 
名 空间 ， 虚 拟 机 需要 在 方法 表 中 得 知 每 个 类 都 是 由 哪个 类 装载 器 装载 的 。 

3) 指向 Class 类 的 引用 

对 于 每 一 个 被 装载 的 类 型 (不 管 是 类 还 是 接口 )， 虚 拟 机 都 会 相应 地 为 它 创建 一 个 
java.lang.Class 类 的 实例 ， 而 且 虚 拟 机 还 必须 以 某 种 方式 把 这 个 实例 和 存储 在 方法 区 中 的 类 
型 数据 关联 起 来 。 

在 你 的 Java 程序 中 ， 你 可 以 得 到 并 使 用 指向 Class 对 象 的 引用 。Class 类 中 的 一 个 静态 
方法 可 以 让 用 户 得 到 任何 已 装载 的 类 的 Class 实例 的 引用 。 


public static Class forName (String className) 7 
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fi jodibuik 


= Wy 和 = 权衡 优化 、 高 效 和 安全 的 最 优 方案 


比如 ， 如 果 调用 forName(“java.lang.Object”)， 那 么 将 得 到 一 个 代表 java.lang.Object 
的 Class 对 象 的 引用 。 可 以 使 用 forName() 来 得 到 代表 任何 包 中 任何 类 型 的 Class 对 象 的 引 
用 ， 只 要 这 个 类 型 可 以 被 (或 者 已 经 被 ) 装 载 到 当前 命名 空间 中 。 如 果 虚 拟 机 无 法 把 请 求 的 
类 型 装载 到 当前 命名 空间 ， 那 么 forName0 会 抛 出 ClassNotFoundException 异常 。 

另 一 个 得 到 Class 对 象 引用 的 方法 是 ， 可 以 调用 任何 对 象 引用 的 getClass() 方 法 。 这 个 
方法 被 来 自 Object 类 本 身 的 所 有 对 象 继承 : 


Public final Class getClass () 7 


比如 ， 如 果 你 有 一 个 到 java.lang.integer 类 的 对 象 的 引用 ， 那 么 你 只 需要 简单 地 调用 
Integer 对 象 引用 的 getClass() 方 法 ， 就 可 以 得 到 表示 java.lang.Integer 类 的 Class 对 象 。 

给 出 一 个 指向 Class 对 象 的 引用 ， 就 可 以 通过 Class 类 中 定义 的 方法 来 找 出 这 个 类 型 的 
相关 信息 。 如 果 查 看 这 些 方 法 ， 会 很 快意 识 到 ，Class 类 使 得 运行 程序 可 以 访问 方法 区 中 保 
存 的 信息 。 下 面 是 在 Class 类 中 声明 的 方法 : 


Public String getName () ; 

Public Class getsupperClass(); 
Public Boolean isInterface(); 

Public Class[] getInterfaces(); 
Public ClassLoader getClassLoader (); 


这 些 方 法 仅 能 够 返回 已 装载 类 型 的 信息 。getName0 返 回 类 型 的 全 限定 名 ， 
getSupperClass() 返 回 类 型 的 直接 超 类 的 Class 实例 。 如 果 类 型 是 java.lang.Object 类 或 者 是 
一 个 接口 ， 它 们 都 没有 超 类 ，getSupperClass0 返 回 null。isInterface() 判 断 该 类 型 是 否 是 接 
口 ， 如 果 Class 对 象 描述 一 个 接口 就 返回 tme; 如 果 它 描述 一 个 类 则 返回 false， 
getInterfaces() 返 回 一 个 Class 对 象 数 组 ， 其 中 每 个 Class 对 象 对 应 一 个 直接 超 接口 ， 超 接口 
在 数组 中 以 类 型 声明 超 接口 的 顺序 出 现 。 如 果 该 类 型 没有 直接 超 接口 ，getImterfacesO0 则 返 
回 一 个 长 度 为 零 的 数组 。getClassLoader() 返 回 装载 该 类 型 的 ClassLoader 对 象 的 引用 ， 如 果 
类 型 是 由 启动 类 装载 器 装载 的 ， 则 返回 null。 所 有 这 些 信息 都 直接 从 方法 区 中 获得 。 

方法 表 为 了 尽 可 能 提高 访问 效率 ， 设 计 者 必须 仔细 设计 存储 在 方法 区 中 的 类 型 信息 的 
数据 结构 ， 因 此 ， 除 了 以 上 讨论 的 原始 类 型 信息 ， 实 现 中 还 可 能 包括 其 他 数据 结构 以 加 快 
访问 原始 数据 的 速度 ， 比 如 方法 表 。 虚 拟 机 对 每 个 装载 的 非 抽象 类 ， 都 声称 了 一 个 方法 
表 ， 把 它 作为 类 信息 的 一 部 分 保存 在 方法 区 。 方 法 表 是 一 个 数组 ， 它 的 元 素 是 所 有 它 的 实 
例 可 能 被 调用 的 实例 方法 的 直接 引用 ， 包 括 那些 从 超 类 继承 过 来 的 实例 方法 。 

4) 方法 区 使 用 示例 

接 下 来 将 通过 一 个 简单 示例 来 展示 虚拟 机 如 何 使 用 方法 区 中 的 信息 ， 看 如 下 类 的 实现 
代码 : 


public class EXAM { 
private int speed = 5;// Skilometers Per hour 
void flow() { 
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public static void main(String[]args) { 
EXAMEXAM = new EXAM(); 
EXAM.flow(); 
} 
| 
下 面 的 段落 描述 了 某 个 实现 中 是 如 何 执 行 Mmm 程序 中 main() 方 法 的 字 节 码 中 第 一 条 
指令 的 。 不 同 的 虚拟 机 实现 可 能 会 用 完全 不 同 的 方法 来 操作 ， 下 面 描述 的 可 能 只 是 其 中 的 
一 种 一 一 但 并 不 是 仅 有 的 一 种 ， 接 下 来 看 Java 虚拟 机 是 如 何 执 行 Mmm 程序 中 main() 方 法 
的 第 一 条 指令 。 
要 运行 Mmm 程序 ， 首 先 需要 以 某 种 “依赖 于 实现 的 ”方式 告诉 虚拟 机 “Mmm” 这 个 
名 字 。 之 后 ， 虚 拟 机 将 找到 并 读 入 相应 的 class 文件 “Mmm.class”， 然 后 它 会 从 导入 的 
class 文件 里 的 二 进 制 数 据 中 提取 类 型 信息 并 放 到 方法 区 中 。 通 过 执行 保存 在 方法 区 中 的 字 
节 码 ， 虚 拟 机 开始 执行 main() 方 法 ， 在 执行 时 ， 它 会 一 直 持 有 指向 当前 类 的 常量 池 的 
指针 。 


5.3.5 堆 


Java 程序 在 运行 时 创建 的 所 有 类 实例 或 数组 都 放 在 同一 个 堆 中 。 而 一 个 Java 虚拟 机 实 
例 中 只 存在 一 个 堆 空间 ， 因 此 所 有 线程 都 将 共享 这 个 堆 。 又 由 于 一 个 Java 程序 独占 一 个 
Java 虚拟 机 实例 ， 因 而 每 个 Java 程序 都 有 它 自 己 的 堆 空 间 一 一 它们 不 会 彼此 干扰 。 但 是 同 
一 个 Java 程序 的 多 个 线程 却 共享 着 同一 个 堆 空间 ， 在 这 种 情况 下 ， 就 得 考虑 多 线程 访问 对 
象 ( 堆 数据 ) 的 同步 问题 了 。 

Java 虚拟 机 有 一 条 在 堆 中 分 配 新 对 象 的 指令 ， 却 没有 释放 内 存 的 指令 。 正 如 我 们 无 法 
使 用 Java 代码 去 明确 释放 一 个 对 象 一 样 ， 字 节 码 指令 也 没有 对 应 的 功能 。 虚 拟 机 自己 负责 
决定 如 何以 及 何 时 释放 不 再 被 运行 的 程序 引用 的 对 象 所 占据 的 内 存 。 程 序 本 身 不 用 去 考虑 
何 时 需 回收 对 象 所 占用 的 内 存 ， 通 常 虚拟 机 把 这 个 人 物 交 给 垃圾 收集 器 。 

1) 垃圾 收集 

垃圾 收集 器 的 主要 工作 就 是 自动 回收 不 再 被 运行 的 程序 引用 的 对 象 所 占用 的 内 存 。 此 
外 ， 它 也 可 能 去 移动 那些 还 在 使 用 的 对 象 ， 以 此 减少 堆 碎 片 。 

Java 虚拟 机 规范 并 没有 强制 规定 垃圾 收集 器 ， 它 只 要 求 虚 拟 机 实现 必须 “以 某 种 方 
式 ” 管 理 自己 的 堆 空间 。 举 个 例子 ， 某 个 实现 可 能 只 有 固定 大 小 的 堆 空间 可 用 ， 当 空间 填 
满 ， 它 就 简单 地 抛 出 OutOfMemory 异常 ， 根 本 不 去 考虑 回收 垃圾 对 象 的 问题 。 这 样 的 一 
个 实现 虽然 简陋 ， 但 却 是 符合 规范 的 。 总 之 ，Java 虚拟 机 规范 并 没有 规定 具体 的 实现 必须 
为 Java 程序 准备 多 少 内 存 ， 也 没有 说 它 必须 怎么 管理 自己 的 堆 空 间 ， 它 仅仅 告诉 实现 的 设 
计 者 : Java 程序 需要 从 堆 中 为 对 象 肥 培 空间 ， 并 且 程 序 本 身 不 会 主动 释放 它 。 因 此 堆 空间 
的 管理 (包括 垃圾 收集 ) 问 题 得 由 设计 者 自行 去 考虑 处 理 方式 。 

Java 虚拟 机 规范 没有 指定 垃圾 收集 应 该 采用 什么 技术 。 这 些 都 由 虚拟 机 的 设计 者 根据 
他 们 的 目标 、 考 虑 所 受 的 限制 、 用 自己 的 能 力 去 决定 什么 才 是 最 好 的 技术 。 因 为 到 对 象 的 
引用 可 能 很 多 地 方 都 存在 ， 如 java 栈 、 堆 、 方 法 区 、 本 地 方法 栈 ， 所 以 垃圾 收集 技术 的 使 
用 在 很 大 程度 上 会 影响 到 运行 时 数据 区 的 设计 。 
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和 方法 区 一 样 ， 堆 空间 也 不 必 是 连续 的 内 存 区 。 在 程序 运行 时 ， 它 可 以 动态 扩展 或 收 
缩 。 事实 上 ， 一 个 实现 的 方法 区 可 以 在 堆 顶 实现 。 换 句 话 说 ， 就 是 当 虚 拟 机 需要 为 一 个 新 
装载 的 类 分 配 内 存 时 ， 类 型 信息 和 实际 对 象 可 以 都 在 同一 个 堆 上 。 因 此 ， 负 责 回收 无 用 对 
象 的 垃圾 收集 器 可 能 也 要 负责 无 用 类 的 释放 ( 印 载 )。 另 外 ， 某 些 实现 可 能 也 允许 用 户 或 程 
序 员 指 定 堆 的 初始 大 小 、 最 大 最 小 值 等 。 

2) 对 象 的 内 部 表示 

Java 虚拟 机 规范 并 没有 规定 Java 对 象 在 堆 中 是 如 何 表示 的 。 对 象 的 内 部 表示 也 影响 着 
整个 堆 以 及 垃圾 收集 器 的 设计 ， 它 由 虚拟 机 的 实现 者 决定 。 

Java 对 象 中 包含 的 基本 数据 由 它 所属 的 类 及 其 所 有 超 类 声明 的 实例 变量 组 成 。 只 要 有 
一 个 对 象 引 用 ， 虚 拟 机 就 必须 能 够 快速 地 定位 对 象 实例 的 数据 。 另 外 ， 它 也 必须 能 通过 该 
对 象 引用 访问 相应 的 类 数据 (存储 于 方法 区 的 类 型 信息 )。 因 此 在 对 象 中 通常 会 有 一 个 指向 
方法 区 的 指针 。 

一 种 可 能 的 堆 空间 设计 就 是 ， 把 堆 分 为 两 部 分 : 一 个 句柄 池 和 一 个 对 象 池 。 而 一 个 对 
象 引用 就 是 一 个 指向 句柄 池 的 本 地 指针 。 句 柄 池 的 每 个 条 目 有 两 个 部 分 : 一 个 指向 对 象 实 
例 变量 的 指针 ， 一 个 指向 方法 区 类 型 数据 的 指针 。 这 种 设计 的 好 处 是 有 利于 堆 碎片 的 整 
理 ， 当 移动 对 象 池 中 的 对 象 时 ， 句 柄 部 分 只 需要 更 改 一 下 指针 指向 对 象 的 新 地 址 就 可 以 了 
一 一 就 是 在 句柄 池 中 的 那个 指针 ; 缺点 是 每 次 访问 对 象 的 实例 变量 都 要 经 过 两 次 指针 传 
递 。 这 种 对 象 表示 的 方法 如 图 5-7 所 示 。 


对 象 引用 句柄 池 | | 对 象 池 
| 
|| 指向 对 象 池 的 指针 | | 

指向 句柄 池 的 指针 > | 
指向 类 数据 的 指针 | 实例 数据 | 
五 
类 数据 
历 活 区 


图 5-7 划分 为 对 象 池 和 方法 池 的 对 象 
另 一 种 设计 方法 是 使 对 象 指针 直接 指向 一 组 数据 ， 而 该 数据 包括 对 象 实例 数据 以 及 指 
向 方法 区 中 类 数据 的 指针 ， 如 图 5-8 所 示 。 这 样 设计 的 优 缺点 正好 与 前 面 的 方法 相反 ， 它 
只 需要 一 个 指针 就 可 以 访问 对 象 的 实例 数据 ， 但 是 移动 对 象 就 变 得 更 加 复杂 。 当 使 用 这 种 
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堆 的 虚拟 机 为 了 减少 内 存 碎片 而 移动 对 象 的 时 候 ， 它 必须 在 整个 运行 时 数据 区 中 更 新 指 
向 被 移动 对 象 的 引用 。 


对 象 引用 7 指向 类 数据 的 指针 


指向 句柄 池 的 指针 | 实例 数据 


类 数据 


历法 区 


图 5-8 保持 对 象 和 数据 在 一 起 


有 如 下 几 个 理由 要 求 虚拟 机 必须 能 够 通过 对 象 引用 得 到 类 (类 型 ) 数 据 : 当 程 序 运行 时 
需要 转换 某 个 对 象 引用 为 男 一 种 类 型 时 ， 虚 拟 机 必须 要 检查 这 种 转换 是 否 被 允许 ， 被 转换 
的 对 象 是 否 的 确 是 被 引用 的 对 象 或 者 它 的 超 类 型 。 当 程序 在 执行 instanceof 操作 时 ， 虚 拟 
机 也 进行 了 同样 的 检查 。 在 这 两 种 情况 下 ， 虚 拟 机 都 需要 查看 被 引用 的 对 象 的 类 数据 。 最 
后 ， 当 程序 中 调用 某 个 实例 方法 时 ， 虚 拟 机 必须 进行 动态 绑 定 ， 换 名 话说， 它 不 能 按照 引 
用 的 类 型 来 决定 将 要 调用 的 方法 ， 而 必须 根据 对 象 的 实际 类 。 为 此 ， 虚 拟 机 必须 再 次 通过 
对 象 的 引用 去 访问 类 数据 。 

不 管 虚拟 机 的 实现 使 用 什么 样 的 对 象 表 示 法 ， 很 可 能 每 个 对 象 都 有 一 个 方法 表 ， 因 为 
方法 表 加 快 了 调用 实例 方法 时 的 效率 ， 从 而 对 java 虚拟 机 实现 的 整体 性 能 起 着 非常 重要 的 
正面 作用 。 但 是 Java 虚拟 机 规范 并 未 要 求 必须 使 用 方法 表 ， 所 以 并 不 是 所 有 实现 中 都 会 使 
用 它 。 比 如 那些 具有 严格 内 存 资源 限制 的 实现 ， 或 许 他 们 根本 不 可 能 有 足够 的 额外 内 存 资 
源 来 存储 方法 表 。 如 果 一 个 实现 使 用 方法 表 ， 那 么 仅仅 使 用 一 个 指向 对 象 的 引用 ， 就 可 以 
很 快 地 访问 对 象 的 方法 表 。 

图 5-9 展示 了 一 种 把 方法 表 和 对 象 引用 联系 起 来 的 实现 方式 ， 每 个 对 象 的 数据 都 包含 
一 个 指向 特殊 数据 结构 的 指针 ， 这 个 数据 结构 位 于 方法 区 ， 它 包括 两 部 分 : 

口 一 个 指向 方法 区 对 应 类 数据 的 指针 。 

口 ” 此 对 象 的 方法 表 。 

方法 表 是 一 个 指针 数组 ， 其 中 的 每 一 项 都 是 一 个 指向 “实例 方法 数据 ”的 指针 ， 实 例 
方法 可 以 被 那 类 的 对 象 调用 ， 方 法 表 指 向 的 实例 方法 数据 包括 以 下 信息 : 
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口 ” 此 方法 的 操作 数 栈 和 局 部 变量 去 的 大 小 。 

口 ” 此 方法 的 字 节 码 。 

口 异常 表 。 

对 象 引用 | 二 1 “指向 特殊 结构 的 指针 
实例 数据 
实例 数据 

指向 堆 的 指针 实例 数据 
实例 数据 
焉 


类 中 所 有 数据 的 入 口 点 | ;指向 完整 类 数据 的 指针 
方法 数据 一 一 一 ”指向 方法 数据 的 指针 
方法 数据 一 一 一 ”指向 方法 数据 的 指针 
方法 数据 | 指向 方法 数据 的 指针 

EEK] 
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这 些 信息 足够 虚拟 机 去 调用 一 个 方法 了 ， 方 法 表 中 包含 有 方法 指针 一 一 指向 类 或 其 超 
类 声明 的 方法 的 数据 ， 也 就 是 说 ， 方 法 表 所 指向 的 方法 可 能 是 此 类 声明 的 ， 也 可 能 是 它 继 
承 下 来 的 。 

如 果 读 者 熟悉 C++ 的 内 部 机 制 ， 就 会 发 现 这 和 C++ 的 VTBL(C++ 对 象 的 虚拟 表 ) 非 常 相 
似 。 在 C++ 中 ， 对 象 由 实例 数据 和 一 组 指向 对 象 可 以 调用 的 虚拟 函数 的 指针 组 成 。Java 虚 
拟 机 也 可 以 采用 这 种 方法 ， 虚 拟 机 可 以 在 堆 中 为 每 个 对 象 都 附加 一 个 方法 表 ， 这 样 较 之 
图 5-9 的 方法 会 占用 更 多 的 内 存 ， 但 可 轻微 提高 一 些 效 率 。 一 般 来 说 ， 改 方案 只 是 用 于 内 
存 足 够 充裕 的 系统 。 

图 5-7 和 图 5-8 中 显示 的 还 有 另 一 种 数据 ， 堆 上 的 对 象 数据 中 还 有 一 个 逻辑 部 分 ， 那 
就 是 对 象 锁 ， 这 是 一 个 互 斥 对 象 。 虚 拟 机 中 的 每 个 对 象 都 有 一 个 对 象 锁 ， 它 被 用 于 协调 多 
个 线程 访问 同一 个 对 象 时 的 同步 。 在 任何 时 刻 ， 只 能 有 一 个 线程 “拥有 ”这 个 对 象 锁 ， 因 
此 只 有 这 个 县 策划 那个 才能 访问 该 对 象 的 数据 。 此 时 其 他 希望 访问 这 个 对 象 的 线程 只 能 等 
待 ， 直 到 拥有 对 象 锁 的 线程 释放 锁 ， 当 某 个 线程 拥有 一 个 对 象 锁 后 ， 可 以 继续 对 这 个 锁 追 
加 请 求 。 但 请 求 几 次 ， 必 须 对 应 地 释放 几 次 ， 之 后 才能 轮 到 其 他 线程 。 比 如 一 个 线程 请 求 
了 三 次 锁 ， 在 它 释放 三 次 锁 之 前 ， 它 一 直 保 持 “ 拥 有 ”这 个 锁 。 

很 多 对 象 在 其 整个 生命 周期 内 都 没有 被 任何 线程 加 锁 。 在 线程 实际 请 求 某 个 对 象 的 锁 
之 前 ， 实 现 对 象 锁 需要 的 数据 是 不 必要 的 。 这 样 正如 图 5-7 和 图 5-8 所 示 ， 很 多 实现 不 在 
对 象 自身 内 部 保存 一 个 指向 锁 数据 的 指针 。 而 只 有 当 第 一 次 需要 加 锁 的 时 候 才 分 配对 应 的 
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锁 数 据 ， 但 这 时 虚拟 机 需要 用 某 种 间接 方法 来 联系 对 象 数据 和 对 应 的 锁 数据 ， 例 如 把 锁 数 
据 放 在 一 个 以 对 象 地 址 为 索引 的 搜索 树 中 。 

除了 实现 锁 锁 需 要 的 数据 外 ， 每 个 Java 对 象 逻 辑 上 还 与 实现 等 待 集合 (Wait Set) 的 数据 
相关 联 。 锁 是 用 来 实现 多 个 线程 对 共享 数据 的 互 斥 访问 的 ， 而 等 待 集合 是 用 来 让 多 个 线程 
为 完成 一 个 共同 目标 而 协调 工作 的 。 

等 待 集合 由 等 待 方法 和 通知 方法 联合 使 用 。 每 个 类 都 从 Object 那里 继承 了 三 个 等 待 方 
法 (三 个 名 为 waitO 的 重 载 方法 ) 和 两 个 通知 方法 aotifyg0 和 notifyAll0)。 当 某 个 线程 在 一 个 
对 象 上 调用 等 待 方法 时 ， 虚 拟 机 就 阻塞 这 个 线程 ， 并 把 它 放 在 了 这 个 对 象 的 等 待 集合 中 。 
知道 另 一 个 线程 在 同一 个 对 象 上 调用 通知 方法 ， 虚 拟 机 才 会 在 之 后 的 某 个 时 刻 唤 醒 一 个 或 
多 个 正在 等 待 集合 中 被 阻塞 的 线程 。 正 像 锁 数据 一 样 ， 在 实际 调用 对 象 的 等 待 方法 或 通知 
方法 之 前 ， 实 现 对 象 的 等 待 集合 的 数据 并 不 是 必须 的 。 因 此 许多 虚拟 机 实现 都 把 等 待 集合 
数据 与 实际 对 象 数据 分 开 ， 只 有 在 需要 时 才 为 此 对 象 创建 同步 数据 

最 后 一 种 数据 类 型 一 一 可 以 作为 堆 中 某 个 对 象 映像 的 一 部 分 ， 是 与 垃圾 收集 器 有 关 的 
数据 。 垃 圾 收集 器 必须 (以 某 种 方式 ) 跟 踪 程 序 引 用 的 每 个 对 象 ， 这 个 人 物 不 可 避免 地 要 附 
加 一 些 数据 给 这 些 对 象 ， 数 据 的 类 型 要 视 垃圾 收集 使 用 的 算法 而 定 。 例 如 ， 加 入 垃圾 收集 
器 使 用 “标记 并 清除 ”算法 ， 这 就 需要 能 够 标记 对 象 能 否 被 引用 。 此 外 ， 对 于 不 再 被 引用 
的 对 象 ， 还 需要 指明 它 的 终结 算法 (Finalizer) 是 否 已 经 运行 过 了 。 像 线程 锁 一 样 ， 这 些 数据 
也 可 以 放 在 对 象 数 据 外 。 有 一 些 垃圾 收集 技术 只 在 垃圾 收集 器 运行 时 需要 额外 数据 。 例 如 
“标记 并 清除 ”算法 就 使 用 一 个 独立 的 位 图 来 标记 对 象 的 引用 情况 。 

除了 标记 对 象 的 引用 情况 外 ， 垃 圾 收集 器 还 要 区 分 对 象 是 否 调用 了 终结 方法 。 对 于 在 
其 类 中 声明 了 终结 方法 的 对 象 ， 在 回收 它 之 前 ， 垃 圾 收集 器 必须 调用 它 的 终结 方法 。Java 
语言 规范 指出 ， 垃 圾 收集 器 对 每 个 对 象 只 能 调用 一 次 终结 方法 ， 但 是 允许 终结 方法 复活 这 
个 对 象 ， 即 允许 对 象 再 次 被 引用 。 这 样 当 这 个 对 象 再 次 被 回收 时 ， 就 不 再 调用 终结 方法 
了 。 需 要 终结 方法 的 对 象 不 多 ， 而 需要 复活 的 更 少 ， 所 以 对 一 个 对 象 回收 两 次 的 情况 很 少 
见 。 这 种 用 来 标志 终结 方法 的 数据 虽然 在 逻辑 上 是 对 象 的 一 部 分 ， 但 通常 实现 上 不 随 对 象 
保存 在 堆 中 。 大 部 分 情况 下 ， 垃 圾 收集 器 会 在 一 个 单独 的 空间 保存 这 个 信息 。 

数组 的 内 部 表示 : 在 Java 中 ， 数 组 是 真正 的 对 象 。 和 其 他 对 象 一 样 ， 数 组 总 是 存储 在 
堆 中 。 同 样 ， 和 普通 对 象 一 样 ， 实 现 的 设计 者 将 决定 数组 在 堆 中 的 表示 形式 。 

和 其 他 所 有 对 象 一 样 ， 数 组 也 拥有 一 个 与 它们 的 类 相关 联 的 Class 实例 ， 所 有 具有 相 
同 维度 和 类 型 的 数组 都 是 同一 个 类 的 实例 ， 而 不 管 数组 的 长 度 是 多 少 。 例 如 ， 一 个 包含 3 
个 int 整数 的 数组 和 一 个 包含 300 个 int 整数 的 数组 拥有 同一 个 类 。 数 组 的 长 度 只 与 实例 数 
据 有 关 。 

数组 类 的 名 称 由 两 部 分 组 成 : 每 一 维 用 一 个 方 括号 表示 。 多 为 数组 被 标识 为 数组 的 数 
组 。 比 如 ，int 类 型 的 二 维 数组 ， 将 表示 为 一 个 一 维 数组 ， 其 中 的 每 个 元 素 是 一 个 一 维 数组 
的 引用 。 

在 堆 中 的 每 个 数组 对 象 还 必须 保存 的 数据 是 数组 的 长 度 、 数 组 数据 ， 以 及 某 些 指向 数 
组 的 类 数据 的 引用 。 虚 拟 机 必须 能 够 通过 一 个 数组 对 象 的 引用 得 到 此 数组 的 长 度 ， 通 过 索 
引 访问 其 元 素 ， 调 用 所 有 数组 的 直接 超 类 Object 声明 的 方法 等 。 
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5.3.6 程序 计数 器 


对 于 一 个 运行 中 的 Java 程序 来 说 ， 其 中 的 每 一 个 线程 都 有 自己 的 PC( 程 序 计 数 器 ) 寄 存 
器 ， 它 是 在 该 线程 启动 时 创建 的 。PC 寄存 器 的 大 小 是 一 个 字 长 ， 因 此 它 既 能 持 有 一 个 本 
地 指针 ， 也 能 够 持 有 一 个 retumAddress。 当 线程 执行 某 个 Java 方法 时 ，PC 寄存 器 的 内 容 
总 是 笑 一 天 将 被 执行 指令 的 “地 址 ”， 这 里 的 “地 址 ”可 以 是 一 个 本 地 指针 ， 也 可 以 是 在 
方法 字 节 码 中 相对 于 该 方法 起 始 指令 的 偏 移 量 。 如 果 该 线程 正在 执行 一 个 本 地 方法 ， 那 么 
此 时 PC 寄存 器 的 值 是 “undefined”。 


5.3.7 Java 栈 


每 当 启动 一 个 新 线程 时 ，Java 虚拟 机 都 会 为 它 分 配 一 个 Java 栈 。 前 面 我 们 曾经 提 到 ， 
Java 栈 以 帧 为 单位 保存 线程 的 运行 状态 。 虚 拟 机 只 会 直接 对 Java 栈 执行 两 种 操作 : 以 帧 为 
单位 的 压 栈 和 出 栈 。 

某 个 线程 正在 执行 的 方法 被 称 为 该 线程 的 当前 方法 ， 当 前 方法 使 用 的 栈 帧 成 为 当前 
帧 ， 当 前 方法 所 属 的 类 成 为 当前 类 ， 当 前 类 的 常量 池 成 为 当前 常量 池 。 在 线程 执行 一 个 方 
法 时 ， 它 会 跟踪 当前 类 和 当前 常量 池 。 此 外 ， 当 虚拟 机 遇 到 栈 内 操作 指令 时 ， 它 对 当前 由 
内 数据 执行 操作 。 

每 当 线程 调用 一 个 Java 方法 时 ， 虚 拟 机 都 会 在 该 线程 的 Java 栈 中 压 入 一 个 新 帧 。 而 
这 个 新 帧 自然 就 成 为 了 当前 帧 。 在 执行 这 个 方法 时 ， 它 使 用 这 个 帧 来 存储 参数 、 局 部 变 
量 、 中 间 运 算 结果 等 等 数据 。 

Java 方法 可 以 以 两 种 方式 完成 : 一 种 是 通过 retum 返回 的 ， 称 为 正常 返回 ， 一 种 是 通 
过 抛 出 异常 而 异常 中 止 的 。 不 管 以 哪 种 方式 返回 ， 虚 拟 机 都 会 将 当前 帧 弹出 Java 栈 ， 然 后 
释放 掉 ， 这 样 上 一 个 方法 的 帧 就 成 为 当前 帧 了 。 

Java 栈 上 的 所 有 数据 都 是 此 线程 私有 的 。 任 何 线程 都 不 能 访问 另 一 个 线程 的 栈 数 据 ， 
因此 我 们 不 需要 考虑 多 线程 情况 下 栈 数据 的 访问 同步 问题 。 当 一 个 线程 调用 一 个 方法 时 ， 
方法 的 局 部 变量 保存 在 调用 线程 Java 栈 的 帧 中 。 只 有 一 个 线程 总 是 访问 哪些 局 部 变量 ， 即 
调用 方法 的 线程 。 

像 方法 区 和 堆 一 样 ，Java 栈 和 帧 在 内 存 中 也 不 必 是 连续 的 。 帧 可 以 分 布 在 连续 的 栈 

也 可 以 分 布 在 堆 里 ， 或 者 二 者 兼 而 有 之 。 表 示 Java 栈 和 栈 帧 的 实际 数据 结构 由 虚拟 机 
的 实现 者 决定 。 某 些 实现 允许 用 户 指 定 Java 栈 的 初始 大 小 和 最 大 最 小 值 。 


5.3.8 栈 帧 


栈 帧 由 局 部 变量 区 、 操 作 数 栈 和 帧 数据 区 构成 。 局 部 变量 区 和 操作 数 栈 的 大 小 要 视 对 
应 的 方法 而 定 ， 它 们 是 按 字 长 计算 的 。 编 译 器 在 编译 时 就 确定 了 这 些 值 并 放 在 class 文件 
中 。 而 帧 数据 区 的 大 小 依赖 于 具体 的 实现 。 

当 虚 拟 机 调用 一 个 Java 方法 时 ， 它 从 对 应 类 的 类 型 信息 中 得 到 此 方法 的 局 部 变量 区 和 
操作 数 栈 的 大 小 ， 并 据 此 分 配 栈 帧 内 存 ， 然 后 压 入 Java 栈 中 。 
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1) 局 部 变量 区 

Java 栈 帧 的 局 部 变量 区 被 组 织 为 一 个 以 字 长 为 单位 ， 从 0 开始 计数 的 数组 。 字 节 码 指 
令 通 过 从 0 开始 的 索引 来 使 用 其 中 的 数据 。 类 型 为 int、float、reference 和 returnAddress 的 
值 在 数组 中 只 占据 一 项 ， 而 类 型 为 byte、short 和 char 的 值 在 存 入 数组 前 都 被 转换 为 int 
值 ， 因 而 同样 占据 一 项 。 但 是 类 型 为 long 和 double 的 值 在 数组 中 却 占 连续 的 两 项 。 

在 访问 局 部 变量 中 的 long 和 double 值 的 时 候 ， 指 令 只 需 指出 连续 两 项 中 第 一 项 的 索 
引 值 。 例 如 某 个 long 值 占据 第 三 四 项 ， 那 么 指令 会 取 索 引 为 3 的 long 值 。 局 部 变量 区 的 
所 有 值 都 是 字 对 齐 的 ，long 和 double 这 样 占据 两 项 数组 元 素 的 值 同样 可 以 起 始 于 任何 
索引 。 

局 部 变量 区 包含 对 应 方法 的 参数 和 局 部 变量 。 编 译 器 首先 按 声明 的 顺序 把 这 些 参数 放 
入 局 部 变量 数组 。 例 如 下 面 的 代码 描绘 了 两 个 方法 的 局 部 变量 区 。 


public class Example3a { 
public static int runClassMethod (int i, long 1, float f, double d, 
Object o, byte b) { 
return 0; 
we intrunMethod (char c, double d, short s, boolean b) { 
return 0; 
, } 
在 上 述 方法 runMethod0 中 ， 局 部 变量 中 第 一 个 参数 是 一 个 reference( 引 用 ) 类 型 ， 尽 管 
在 方法 源 代码 中 没有 显 式 声明 这 个 参数 ， 但 这 个 参数 this 对 于 任何 一 个 实例 方法 都 是 隐 含 
加 入 的 ， 它 用 来 表示 调用 该 方法 的 对 象 本 身 ， 与 此 相反 ， 方 法 mnClassMethod() 中 就 没有 
这 个 隐 含 的 this 变量 ， 因 为 它 是 一 个 类 方法 。 类 方法 只 与 类 相关 ， 而 与 具体 的 对 象 无 关 ， 
不 能 直接 通过 类 方法 访问 类 实例 的 变量 ， 因 为 在 方法 调用 的 时 候 没有 关联 到 一 个 具体 
实例 。 
我 们 注意 到 ， 在 源 代码 中 的 byte、short、char 和 boolean 在 局 部 变量 区 都 被 转换 成 了 
int， 在 操作 数 栈 中 也 一 样 ， 前 面 我 们 曾经 说 过 ， 虚 拟 机 并 不 直接 支持 boolean 类 型 ， 因 此 
Java 编译 器 总 是 用 int 来 表示 boolean， 但 Java 虚拟 机 直接 支持 byte、short 和 char 类 型 ， 
这 些 类 型 的 值 既 可 以 作为 实例 变量 或 者 数组 元 素 存储 在 局 部 变量 区 ， 也 可 以 作为 类 变量 存 
储 在 方法 区 中 。 但 是 在 局 部 变量 区 和 操作 数 栈 中 都 会 被 转换 成 int 类 型 的 值 ， 它 们 在 栈 帧 
中 的 时 候 都 是 当 作 int 来 进行 处 理 的 。 只 有 当 它 被 存 回 堆 或 方法 区 时 ， 才 会 转换 回 原来 的 
类 型 。 
同样 需要 注意 的 是 作为 mnClassMethod() 的 引用 被 传递 的 参数 Objecto。 在 Java 中 ， 所 
有 的 变量 都 按 引用 传递 ， 并 且 都 存储 在 堆 中 ， 永 远 都 不 会 在 局 部 变量 区 或 操作 数 栈 中 发 现 
对 象 的 拷贝 ， 只 会 有 对 象 引 用 。 
除了 Java 方法 的 参数 (编译 器 首先 严格 按照 它们 的 声明 顺序 放 到 局 部 变量 数组 中 ， 而 
对 于 真正 的 局 部 变量 ， 它 可 以 任意 决定 放置 顺序 ， 甚 至 可 以 用 一 个 索引 指 代 两 个 局 部 变量 ) 
一 一 比如 当 两 个 局 部 变量 的 作用 域 不 重 难 时 ， 像 下 面 Example3b 中 的 局 部 变量 i 和 j 就 是 
这 种 情况 : 在 方法 的 前 半 段 ， 在 j 开始 生效 前 ，0 号 索引 的 入 口 可 以 被 用 来 代表 i 在 方法 的 
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后 半 段 ，i 已 经 超过 了 有 效 作用 域 ，0 号 入 口 就 可 以 用 来 表示 j 了 。 


class Example3b 1{ 
public void runTwoLoops() { 
fori (int i = ORL CUD AE 
System.out .println(i); 


0 (nt ="02 1] <LOr IR 
System-out .println(j); 
} 

} 

和 其 他 运行 时 内 存 区 一 样 ， 虚 拟 机 的 实现 者 可 以 为 局 部 变量 区 设计 任意 的 数据 结构 。 
比如 对 于 怎样 把 long 和 double 类 型 的 值 存储 到 两 个 数组 项 中 ，Java 虚拟 机 规范 没有 指 
定 。 假 如 某 个 虚拟 机 实现 的 字 长 为 64 位 ， 这 时 就 可 以 把 整个 long 或 double 数据 放 在 数组 
中 相 邻 两 数组 项 的 低 项 内 ， 而 使 高 项 保持 为 空 。 

2) 操作 数 栈 

操作 数 栈 和 局 部 变量 区 一 样 ， 操 作 数 栈 也 是 被 组 织 成 一 个 以 字 长 为 单位 的 数组 。 但 是 
和 前 者 不 同 的 是 ， 它 不 是 通过 索引 来 访问 ， 而 是 通过 标准 的 栈 操作 一 一 压 栈 和 出 栈 一 一 来 
访问 的 。 比 如 ， 如 果 某 个 指令 把 一 个 值 压 入 到 操作 数 栈 中 ， 稍 后 另 一 个 指令 就 可 以 弹出 这 
个 值 来 使 用 。 

虚拟 机 在 操作 数 栈 中 存储 数据 的 方式 和 在 局 部 变量 区 中 是 一 样 的 ， 如 int、long、 
float、double、reference 和 retumType 的 存储 。 对 于 byte、short 以 及 char 类 型 的 值 在 压 入 
到 操作 数 栈 之 前 ， 也 会 被 转换 为 int。 

不 同 于 程序 计数 器 ，Java 虚拟 机 没有 寄存 器 ， 程 序 计 数 器 也 无 法 被 程序 指令 直接 访 
问 。Java 虚拟 机 的 指令 是 从 操作 数 栈 中 而 不 是 从 寄存 器 中 取得 操作 数 的 ， 因 此 它 的 运行 方 
式 是 基于 栈 的 而 不 是 基于 寄存 器 的 。 虽 然 指令 也 可 以 从 其 他 地 方 取得 操作 数 ， 比 如 从 字 节 
码 流 中 跟随 在 操作 吗 (代表 指令 的 字 节 ) 之 后 的 字 节 中 或 从 常量 池 中 ， 但 是 主要 还 是 从 操作 
数 栈 中 获得 操作 数 。 

虚拟 机 把 操作 数 栈 作为 它 的 工作 区 一 一 大 多 数 指令 都 要 从 这 里 弹出 数据 ， 执 行 运算 ， 
然后 把 结果 压 回 操作 数 栈 。 比 如 ，iadd 指令 就 要 从 操作 数 栈 中 弹出 两 个 整数 ， 执 行 加 法 运 
算 ， 其 结果 又 压 回 到 操作 数 栈 中 ， 看 看 下 面 的 示例 ， 它 演示 了 虚拟 机 是 如 何 把 两 个 int 类 
型 的 局 部 变量 相 加 ， 再 把 结果 保存 到 第 三 个 局 部 变量 的 : 


Iload 0 //push the int in localvariable 0 

Iload 1 //push the int in localvariable 1 

Iadd // pop two ints , add them , push result 

Istore 2 //pop int, store into local variable 2 

在 这 个 字 节 码 序列 里 ， 前 两 个 指令 iload 0 和 iload_1 将 存储 在 局 部 变量 中 索引 为 0 和 
1 的 整数 压 入 操作 数 栈 中 ， 其 后 iadd 指令 从 操作 数 栈 中 弹出 那 两 个 整数 相 加 ， 再 将 结果 压 
入 操作 数 栈 。 第 四 条 指令 istore 2 则 从 操作 数 栈 中 弹出 结果 ， 并 把 它 存 储 到 局 部 变量 区 索 
引 为 2 的 位 置 。 
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3) 帧 数据 区 

除了 局 部 变量 区 和 操作 数 栈 外 ，Java 栈 帧 还 需要 一 些 数据 来 支持 常量 池 解 析 、 正 常 方 
法 返回 以 及 异常 派发 机 制 。 这 些 信息 都 保存 在 Java 栈 帧 的 帧 数据 区 中 。 

Java 虚拟 机 中 的 大 多 数 指令 都 涉及 常量 池 入 口 。 有 些 指令 仅仅 是 从 常量 池 中 取出 数据 
然后 压 入 Java 栈 (这 些 数据 的 类 型 包括 int、long、float、double 和 String); 还 有 些 指令 使 
用 常量 池 的 数据 来 指示 要 实例 化 的 类 或 数组 ， 要 访问 的 字段 ， 或 要 调用 的 方法 ， 还 有 些 指 
令 需 要 常量 池 中 的 数据 才能 确定 某 个 对 象 是 否 属 于 某 个 类 或 实现 了 某 个 接口 。 

每 当 虚 拟 机 要 执行 某 个 需要 用 到 常量 池 数据 的 指令 时 ， 它 都 会 通过 帧 数据 区 中 指向 常 
量 池 的 指针 来 访问 它 。 以 前 讲 过 ， 常 量 池 中 对 类 型 、 字 段 和 方法 的 引用 在 开始 时 都 是 符 
号 。 当 虚拟 机 在 常量 池 中 搜索 的 时 候 ， 如 果 遇 到 指向 类 、 接 口 、 字 段 或 者 方法 的 入 口 ， 假 
若 它们 仍然 是 符号 ， 虚 拟 机 那 是 才 会 (也 必须 ) 进 行 解析 。 

除了 用 于 常量 池 的 解析 外 ， 帧 数据 区 还 要 帮助 虚拟 机 处 理 Java 方法 的 正常 结束 或 异常 
中 止 。 如 果 是 通过 retum 正常 结束 ， 虚 拟 机 必须 恢复 发 起 调用 的 方法 的 栈 帧 ， 包 括 设置 PC 
寄存 器 指向 发 起 调用 的 方法 中 的 指令 一 一 即 紧 跟着 调用 了 完成 方法 的 指令 的 下 一 个 指令 。 
假如 方法 有 返回 值 ， 虚 拟 机 必须 将 它 压 入 到 发 起 调用 的 方法 的 操作 数 栈 。 

为 了 处 理 Java 方法 执行 期 间 的 异常 退出 情况 ， 帧 数据 区 还 必须 保存 一 个 对 此 方法 异常 
表 的 引用 。 异 常 表 定义 了 在 这 个 方法 的 字 节 码 中 受 catch 子 句 保护 的 范围 ， 异 常 表 中 的 每 
一 项 都 有 一 个 被 catch 子 句 保护 的 代码 的 起 始 和 结束 为 止 ( 即 try 子 句 内 部 的 代码 )， 可 能 被 
catch 的 异常 类 在 常量 池 中 的 索引 值 ， 以 及 catch 子 句 内 的 代码 开始 的 位 置 。 

当 某 个 方法 抛 出 异常 时 ， 虚 拟 机 根据 帧 数据 区 对 应 的 异常 表 来 决定 如 何 处 理 。 如 果 在 
异常 表 中 找到 了 匹配 的 catch 子 句 ， 就 会 把 控制 权 转 交 给 catch 子 句 内 的 代码 。 如 果 没 有 发 
现 ， 方 法 会 立即 异常 中 止 。 然 后 虚拟 机 使 用 帧 数据 区 的 信息 回复 发 起 调用 的 方法 的 帧 ， 然 
后 在 发 起 调用 的 方法 的 上 下 文中 重新 抛 出 同样 的 异常 。 

除了 上 述 信息 (支持 常量 池 解 析 、 正 常 方法 返回 和 异常 派发 的 数据 ) 外 ， 虚 拟 机 的 实现 
者 也 可 以 将 其 他 信息 放 入 帧 数据 区 ， 如 用 于 调试 的 数据 等 。 

4) Java 栈 的 可 能 实现 方式 

程序 设计 者 可 以 按 自己 的 想法 来 随意 设计 Java 栈 ， 例 如 一 个 可 能 的 方式 就 是 从 堆 中 分 
配 每 一 个 帧 。 例 如 考虑 下 面 的 类 : 


class Example3c { 
public static void addqandPrint() { 
double result = addTwoTypes (1,88.88); 
System.out .println (result); 


} 
public static double addTwoTypes (int i, double d) { 
return i+d; 
} 
} 
在 Java 虚拟 机 的 实现 中 ， 每 个 帧 都 可 以 单独 从 堆 中 分 配 。 为 了 调用 方法 
addTwoTypes0 和 方法 addAndPrint()。 首 先 把 int 1 和 double 88.88 压 入 到 它 的 操作 数 栈 
中 ， 然 后 调用 addTwoTypes() 方 法 。 
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调用 addTwoTypes() 的 指令 指向 一 项 常量 池 的 数据 ， 因 此 虚拟 机 在 常量 池 中 查找 这 些 
数据 ， 这 期 间 如 有 必要 还 需要 进行 解析 。 

在 此 需要 注意 的 是 ， 方 法 addAndPrint0) 也 要 使 用 常量 池 才 能 确定 addTwoTypes() 方 
法 ， 尽 管 这 两 个 方法 是 属于 一 个 类 的 。 由 此 可 见 ， 和 引用 其 他 类 的 字段 或 方法 一 样 ， 对 同 
一 个 类 的 方法 和 字段 的 引用 初始 时 也 是 符号 ， 因 此 在 使 用 之 前 同样 需要 解析 。 

解析 后 的 常量 池 数 据 项 将 指向 方法 区 中 对 应 方法 addTwoTypes() 的 信息 。 虚 拟 机 需要 
使 用 这 些 信息 来 决定 addTwoTypes() 的 局 部 变量 区 和 操作 数 栈 的 大 小 。 如 果 使 用 Sun 的 
javac 编译 器 的 话 ，addTwoTypes0 的 局 部 变量 区 需要 3 个 字 长 ， 操 作 数 栈 需 要 4 个 字 长 ( 帧 
数据 区 的 大 小 依赖 于 具体 的 实现 )。 虚 拟 机 紧 接着 从 堆 中 为 这 个 方法 分 配 足够 大 的 栈 帧 。 然 
后 从 方法 addAndPrintO 的 操作 数 栈 中 弹出 double 参数 和 int 参数 ， 并 把 它们 分 别 放 在 
addTwoTypes() 的 局 部 变量 区 中 索引 为 1 和 0 的 位 置 。 

当 addTwoTypes0 返 回 时 ， 它 首先 把 类 型 为 double 的 返回 值 压 入 自己 的 操作 数 栈 里 。 
紧 接着 虚拟 机 使 用 帧 数据 区 中 的 信息 找到 调用 者 ( 即 addAndPrintO) 的 栈 帧 ， 然 后 将 返回 值 
压 入 addAndPrint(O) 的 操作 数 栈 中 并 释放 方法 addTwoPrintO 的 栈 帧 所 占用 的 内 存 ， 然 后 虚拟 
机 把 addTwoTypes(O) 的 栈 帧 作为 当前 帧 ， 从 调用 执行 的 下 一 条 指令 开始 继续 执行 方法 
addAndPrint()。 

其 实 还 有 另外 一 种 虚拟 机 实现 执行 同一 方法 的 Java 栈 方式 ， 它 的 栈 帧 不 是 从 堆 中 单独 
分 配 ， 而 是 从 一 个 连续 的 栈 中 分 配 ， 因 而 这 种 方式 允许 相 邻 方法 的 栈 帧 可 以 相互 重 倒 。 这 
里 调用 者 的 操作 数 栈 部 分 ( 它 包含 要 传 给 被 调用 者 的 参数 ) 就 成 为 了 被 调用 者 的 局 部 变量 区 
的 底层 。 在 这 个 例子 中 ，addAndPrint() 的 整个 操作 数 栈 刚好 成 为 addTwoPrint() 的 整个 局 部 
变量 区 。 这 种 方式 不 仅 节 省 了 内 存 空间 ， 因 为 发 起 调用 的 方法 和 被 调用 的 方法 用 相同 的 内 
存 保存 参数 ， 而 且 也 节省 了 时 间 ， 因 为 虚拟 机 不 再 需要 费时 地 把 参数 从 一 个 栈 帧 拷贝 到 另 
一 个 栈 帧 了 。 

注意 当前 帧 的 操作 数 栈 总 是 在 Java 栈 的 “ 顶 ” 部 ， 尽 管 这 样 可 能 可 以 更 好 地 说 明 连续 
内 存 的 实现 ， 但 不 管 Java 栈 是 如 何 实现 的 ， 对 操作 数 栈 的 压 入 (或 者 从 栈 中 弹出 ) 总 是 在 当 
前 帧 执行 的 ， 这 样 在 当前 帧 的 操作 数 栈 中 压 入 一 个 值 也 可 以 看 作 是 往 整 个 Java 栈 压 入 一 
个 值 。 

Java 栈 还 有 一 些 其 他 的 实现 方式 ， 但 基本 上 都 是 上 述 两 种 情形 的 混合 。 比 如 虚拟 机 可 
以 在 线程 启动 时 就 从 栈 中 分 出 一 大 段 空间 ， 之 后 只 要 还 在 这 段 连续 的 空间 里 ， 虚 拟 机 都 可 
以 采用 上 面 介绍 的 重 登 方法 。 如 果 栈 生长 超过 了 这 段 连续 空间 ， 虚 拟 机 可 以 再 从 堆 中 分 配 
另 一 段 空 间 。 如 果 发 起 调用 的 方法 的 栈 帧 位 于 旧 的 那 段 空间 中 ， 而 被 调用 的 方法 的 栈 帧 位 
于 新 的 那 段 空 间 ， 就 需要 把 它们 链接 起 来 ， 在 新 的 空间 段 中 ， 虚 拟 机 又 可 以 继续 使 用 连续 
内 存 方法 。 


5.3.9 本 地 方法 栈 


前 面 提 到 的 所 有 运行 时 数据 区 都 是 在 Java 虚拟 机 规范 中 明确 定义 的 ， 除 此 之 外 ， 对 于 
一 个 运行 中 的 Java 程序 而 言 ， 它 还 可 能 会 用 到 一 些 跟 本 地 方法 相关 的 数据 区 。 当 某 个 线程 
调用 一 个 本 地 方法 时 ， 它 就 进入 了 一 个 全 新 的 并 且 不 再 受 虚 拟 机 限制 的 世界 。 本 地 方法 可 
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以 通过 本 地 方法 接口 来 访问 虚拟 机 的 运行 时 数据 区 ， 但 不 止 于 此 ， 它 还 可 以 做 任何 它 想 做 
的 事情 。 比 如 它 甚 至 可 以 直接 使 用 本 地 处 理 器 中 的 寄存 器 ， 或 者 直接 从 本 地 内 存 的 堆 中 分 
配 任意 数量 的 内 存 等 。 总 之 ， 它 和 虚拟 机 拥有 同样 的 权限 (或 者 说 能 力 )。 

本 地 方法 本 质 上 是 依赖 于 实现 的 ， 虚 拟 机 实现 的 设计 者 们 可 以 自由 地 决定 使 用 怎样 的 
机 制 来 让 Java 程序 调用 本 地 方法 。 

任何 本 地 方法 接口 都 会 使 用 某 种 本 地 方法 栈 。 当 线程 调用 Java 方法 时 ， 虚 拟 机 会 创建 
一 个 新 的 栈 帧 并 压 入 Java 栈 。 然 而 当 它 调用 的 是 本 地 方法 时 ， 虚 拟 机 会 保持 Java 栈 不 
变 ， 不 再 在 线程 的 Java 栈 中 压 入 新 的 帧 ， 虚 拟 机 只 是 简单 地 动态 链接 并 直接 调用 指定 的 本 
地 方法 。 可 以 把 这 看 作 是 虚拟 机 利用 本 地 方法 来 动态 扩展 自己 。 就 如 共 Java 虚拟 机 是 的 实 
现在 按照 其 中 运行 的 Java 程序 的 吟 哇 ， 调 用 属于 虚拟 机 内 部 的 另 一 (动态 链接 的 ) 方 法 。 

如 果 某 个 虚拟 机 实现 的 本 地 方法 接口 是 使 用 C 连接 模型 的 话 ， 那 么 它 的 本 地 方法 栈 就 
是 C 栈 。 我 们 知道 ， 当 C 程序 调用 一 个 C 函数 时 ， 其 栈 操作 都 是 确定 的 。 传 递 给 该 函数 
的 参数 以 某 个 确定 的 顺序 压 入 栈 ， 它 的 返回 值 也 以 确定 的 方式 传 回调 用 者 。 同 样 ， 这 就 是 
该 虚拟 机 实现 中 本 地 方法 栈 的 行为 。 

很 可 能 本 地 方法 接口 需要 回调 Java 虚拟 机 中 的 Java 方法 (这 也 是 由 设计 者 决定 的 )， 在 
这 种 情形 下 ， 该 线程 就 会 保存 本 地 方法 栈 的 状态 并 进入 到 另 一 个 Java 栈 。 

就 像 其 他 运行 时 内 存 区 一 样 ， 本 地 方法 栈 占用 的 内 存 区 也 不 必 是 固定 大 小 的 ， 它 可 以 
根据 需要 动态 扩展 或 者 收缩 。 某 些 实现 也 允许 用 户 或 者 程序 员 指定 该 内 存 区 的 初始 大 小 、 
最 大 值 和 最 小 值 。 


5.3.10 执行 引擎 


任何 Java 虚拟 机 实现 的 核心 都 是 它 的 执行 引擎 。 在 Java 虚拟 机 规范 中 ， 执 行 引擎 的 
行为 使 用 指令 集 来 定义 。 对 于 每 条 指令 、 规 范 都 详细 规定 了 当 实 现 执 行 到 该 指令 时 应 该 处 
理 什 么 ， 但 是 却 对 如 何 处 理 言 之 甚 少 。 在 前 面 的 章节 中 提 到 过 ， 实 现 的 设计 者 有 权 决 定 如 
何 执行 字 节 码 ， 实 现 可 以 采取 解释 、 即 时 编译 或 者 直接 用 芯片 上 的 指令 执行 ， 还 可 以 是 它 
们 的 混合 ， 或 任何 你 能 想到 的 新 技术 。 

和 本 章 开头 提 到 的 对 “Java 虚拟 机 ”这 个 术语 有 三 种 不 同 的 理解 一 样 ，“ 执 行 引擎 ” 
这 个 术语 也 可 以 有 如 下 三 种 解释 : 

口 ”抽象 的 规范 。 

口 具体 的 实现 。 

口 ”正在 运行 的 实力 。 

抽象 规范 使 用 指令 集 规定 了 执行 引擎 的 行为 。 具 体 实现 可 能 使 用 多 种 不 同 的 技术 一 一 
包括 软件 方面 、 硬 件 方面 或 数 种 技术 的 集合 。 作 为 运行 时 实例 的 执行 引擎 就 是 一 个 线程 。 

运行 中 Java 程序 的 每 一 个 线程 都 是 一 个 独立 的 虚拟 机 执行 引擎 的 实例 。 从 线程 生命 周 
期 的 开始 到 结束 ， 它 要 么 在 执行 字 节 码 ， 要 么 在 执行 本 地 方法 。 一 个 线程 可 能 通过 解释 或 
者 使 用 芯片 级 指令 直接 执行 字 节 码 ， 或 者 间接 通过 即时 编译 器 质 性 编译 过 的 本 地 代码 。 
Java 虚拟 机 的 实现 可 能 用 一 些 对 用 户 程序 不 可 见 的 线程 ， 比 如 垃圾 收集 器 。 这 样 的 线程 不 
需要 是 实现 的 执行 引擎 的 实例 ， 所 有 属于 用 户 运行 程序 的 线程 ， 都 是 在 实际 工作 的 执行 
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引擎 。 

指令 集 方法 的 字 节 码 流 是 由 Java 虚拟 机 的 指令 序列 构成 的 ， 每 一 条 指令 包含 一 个 单字 
节 的 操作 码 ， 后 面 跟随 0 个 或 多 个 操作 数 。 操 作 码 表明 需要 执行 的 操作 ; 操作 数 向 Java 虚 
拟 机 提供 执行 操作 码 需 要 的 额外 信息 。 操 作 码 本 身 就 已 经 规定 了 它 是 否 需 要 跟随 操作 数 ， 
以 及 如 果 有 操作 数 的 话 ， 它 是 什么 形式 的 。 很 多 Java 虚拟 机 的 指令 不 包含 操作 数 ， 仅 仅 是 
由 一 个 操作 码 字 节 构 成 的 。 根 据 这 些 操作 码 的 需要 ， 虚 拟 机 可 能 除了 跟随 操作 码 的 操作 数 
之 外 ， 还 需要 从 另外 一 些 存储 区 域 得 到 操作 数 。 当 虚拟 机 执行 一 条 指令 的 时 候 ， 可 能 使 用 
当前 常量 池 中 的 项 ， 当 前 帧 的 局 部 变量 中 的 值 ， 或 者 位 于 当前 帧 操作 数 栈 顶 端的 值 。 

抽象 的 执行 引擎 每 次 执行 一 条 字 节 码 指令 。Java 虚拟 机 中 运行 的 程序 的 每 个 线程 (执行 
引擎 实例 ) 都 执行 这 个 操作 。 执 行 引擎 取得 操作 码 ， 如 果 操 作 码 有 操作 数 ， 取 得 它 的 操作 
数 。 它 执行 操作 码 和 跟随 的 操作 数 规定 的 动作 ， 然 后 再 取得 下 一 个 操作 码 。 这 个 执行 字 节 
码 的 过 程 在 线程 完成 前 将 一 直 持续 ， 通 过 从 它 的 初始 方法 返回 ， 或 者 没有 捕获 抛 出 的 异常 
都 可 以 标志 着 线程 的 完成 。 

执行 引擎 会 不 时 遇 到 请 求 本 地 方法 调用 的 指令 。 在 这 个 时 候 ， 虚 拟 机 负责 试 着 发 起 这 
个 本 地 方法 调用 。 如 果 本 地 方法 返回 了 (假设 是 正常 返回 ， 而 不 是 抛 出 了 一 个 异常 )， 执 行 
引擎 会 继续 执行 字 节 码 流 中 的 下 一 条 指令 。 

可 以 这 样 来 看 ， 本 地 方法 是 Java 虚拟 机 指令 集 的 一 种 可 编程 扩展 。 如 果 一 条 指令 请 求 
一 个 对 本 地 方法 的 调用 ， 执 行 引擎 就 会 调用 这 个 本 地 方法 。 运 行 这 个 本 地 方法 就 是 Java 虚 
拟 机 对 这 条 指令 的 执行 。 当 本 地 方法 返回 了 ， 虚 拟 机 继续 执行 下 一 条 指令 。 如 果 本 地 方法 
异常 中 止 了 ( 抛 出 了 一 个 异常 )， 虚 拟 机 就 按照 好 比 是 这 条 指令 抛 出 这 个 异常 一 样 的 步骤 来 
处 理 这 个 异常 。 

执行 一 条 指令 包含 的 任务 之 一 就 是 决定 下 一 条 要 执行 的 是 什么 指令 。 执 行 引擎 决定 下 
一 个 操作 码 时 有 三 种 方法 。 很 多 指令 的 下 一 个 操作 码 就 是 在 当前 操作 码 和 操作 数 之 后 紧 跟 
的 那个 字 节 (如 果 字 节 码 流 里 面 还 有 的 话 )。 另 外 一 些 指令 ， 比 如 goto 或 者 retum， 执 行 引 
擎 决定 下 一 个 操作 码 时 把 它 当 作 当 前 执行 指令 的 一 部 分 。 假 若 一 条 指令 抛 出 了 一 个 异常 ， 
那么 执行 引擎 将 搜索 合适 的 catch 子 句 ， 以 决定 下 一 个 执行 的 操作 码 是 什么 。 

有 些 指令 可 以 抛 出 异常 。 比 如 ，athrow 指令 就 明确 地 抛 出 一 个 异常 。 这 条 指令 就 是 
Java 源 代 码 中 的 throw 语句 的 编译 后 形式 。 每 当 执行 一 条 athrow 指令 的 时 候 ， 它 都 将 抛 出 
一 个 异常 。 其 他 抛 出 异常 的 指令 都 只 有 在 满足 某 些 特定 条 件 的 时 候 才 抛 出 异常 。 比 如 ， 假 
若 Java 迅即 发 现 程序 试图 用 0 除 一 个 整数 ， 它 就 会 抛 出 一 个 ArithmeticException 异常 。 这 
只 有 在 执行 4 条 特定 的 除法 (idev,idiv,irem 和 lrem) 的 时 候 ， 或 者 计算 int 或 者 long 的 余数 
的 时 候 ， 才 可 能 发 生 。 

Java 虚拟 机 指令 集 的 每 种 操作 码 都 有 助 记 符 。 使 用 典型 的 汇编 语言 风格 ，Java 字 节 码 
流 可 以 用 助 记 符 跟着 (可 选 的 ) 操 作 数 值 来 表示 。 

方法 的 字 节 码 流 和 助 记 符 的 例子 如 下 ， 请 读者 重点 考虑 这 个 类 里 的 doMathForever() 
方法 。 

public class Act { 


public static void doMathForever(){ 
nt = 0% 
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方法 doMathForever() 的 字 节 码 流 可 以 被 反 汇编 成 下 面 的 助 记 符 。Java 虚拟 机 规范 中 没 
有 定义 正式 的 方法 字 节 码 的 助 记 符 的 语法 。 下 面 显示 的 代码 说 明了 本 书 所 采用 的 用 助 记 符 
表示 字 节 码 的 方式 。 左 边 的 列表 表示 每 条 指令 开始 时 从 字 节 码 的 开头 开始 算 起 的 每 天 指令 
的 字 节 偏 移 量 ;中间 的 列表 表示 指令 和 它 的 操作 数 ， 右 边 的 列 包 含 注释 ， 用 双 斜 杠 隔 开 ， 
如 同 Java 源 代 码 的 格式 。 

这 种 表示 助 记 符 的 方式 和 Sun 的 Java 2 SDK 里 的 javap 程序 的 输出 很 相似 。 使 用 javap 
可 以 查看 任何 class 文件 中 方法 的 字 节 码 助 记 符 。 请 注意 跳 转 地 址 是 按照 从 方法 起 始 开始 
算 起 的 偏 移 量 来 给 出 的 。Goto 指令 导致 虚拟 机 跳 转 到 从 方法 起 始 计算 的 位 于 偏 移 量 2 的 指 
令 。 实 际 上 操作 数 是 负 7， 要 执行 这 条 指令 ， 虚 拟 机 在 当前 PC 寄存 器 的 内 容 上 加 上 这 个 
操作 数 。 记 过 就 是 iinc 指令 的 地 址 : 偏 移 量 2。 为 了 让 助 记 符 更 加 易 读 ， 所 看 到 的 这 条 跳 
转 指令 后 面 的 操作 数 已 经 是 经 过 计算 后 的 结果 了 。 主 机 符 显示 的 是 “goto2”， 而 不 是 ” 
goto-7”。 

Java 虚拟 机 指令 集 关 注 的 中 心 是 操作 数 栈 。 一 般 是 把 将 要 使 用 的 值 会 压 入 栈 中 。 虽 然 
Java 虚拟 机 没有 保存 任意 值 的 寄存 器 ， 但 每 个 方法 都 有 一 个 局 部 变量 集合 。 指 令 集 实 际 的 
工作 方式 就 是 把 局 部 变量 当 作 寄 存 器 ， 用 索引 来 访问 。 不 过 不 同 于 iine 指令 一 一 它 可 以 直 
接 增加 一 个 局 部 变量 的 值 ， 要 使 用 保存 在 局 部 变量 中 的 值 之 前 ， 必 须 先 将 它 压 入 操作 数 
栈 。 我 们 可 以 看 看 下 面 一 组 指令 在 执行 引擎 中 执行 的 过 程 : 

//JVM 助 记 指令 代码 

iload 0  // 把 存储 在 局 部 变量 区 中 索引 为 0 的 整数 压 入 操作 数 栈 。 

iload 1 ”// 把 存储 在 局 部 变量 区 中 索引 为 1 的 整数 压 入 操作 数 栈 。 

iadd // 从 操作 数 栈 中 弹出 两 个 整数 相 加 ， 在 将 结果 压 入 操作 数 栈 。 

istore 2 // 从 操作 数 栈 中 弹出 结果 。 

//JVM 助 记 指令 代码 。 

iload 0  ”// 把 存储 在 局 部 变量 区 中 索引 为 0 的 整数 压 入 操作 数 栈 。 

iload 1 ”// 把 存储 在 局 部 变量 区 中 索引 为 1 的 整数 压 入 操作 数 栈 。 

iadd // 从 操作 数 栈 中 弹出 两 个 整数 相 加 ， 在 将 结果 压 入 操作 数 栈 。 

istore 2 // 从 操作 数 栈 中 弹出 结果 。 

由 此 可 见 ， 上 面 的 指令 反复 用 到 了 Java 栈 中 的 某 一 个 方法 栈 帧 。 实 际 上 执行 引擎 运行 
Java 字 节 码 指令 很 多 时 候 都 是 在 不 停 地 操作 Java 栈 ， 也 有 的 时 候 需 要 在 堆 中 开辟 对 象 以 
及 运行 系统 的 本 地 指令 等 。 但 是 Java 栈 的 操作 要 比 堆 中 的 操作 要 快 得 多 ， 因 此 反复 开辟 对 
象 是 非常 耗 时 的 。 这 也 是 为 什么 Java 程序 优化 的 时 候 ， 尽 量 减 少 new 对 象 。 

举例 来 说 ， 用 一 个 局 部 变量 除 另 外 一 个 ， 虚 拟 机 必须 把 它们 都 压 入 栈 ， 执 行 除法 ， 然 
后 把 结果 重新 保存 到 局 部 变量 。 要 把 数组 元 素 或 对 象 的 字段 保存 到 局 部 变量 中 ， 虚 拟 机 必 
须 先 把 值 压 入 栈 ， 然 后 保存 到 局 部 变量 中 去 。 要 把 保存 在 局 部 变量 中 的 值 赋 予 数组 元 素 或 
者 对 象 字段 ， 虚 拟 机 必须 按照 相反 的 步骤 操作 。 它 首先 必须 把 局 部 变量 的 值 压 入 栈 ， 然 后 
从 栈 中 弹出 ， 再 放 入 位 于 堆 上 的 数组 元 素 或 对 象 字段 中 。 
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二 = 权衡 优化 、 高 效 和 安全 的 最 优 方案 


Java 虚拟 机 指令 集 的 设计 遵循 几 个 不 同 的 目标 ， 但 它们 之 间 是 有 冲突 的 。 这 几 个 目标 
就 是 本 书 前 面 所 描述 的 整个 Java 体系 结构 的 目的 所 在 : 平台 无 关 性 、 网 络 移动 性 以 及 安 
全 性 。 

平台 无 关 性 是 影响 指令 集 设 计 的 最 大 因素 。 指 令 集 的 这 种 以 栈 为 中 心 、 而 非 以 寄存 器 
为 中 心 的 设计 方法 ， 使 得 在 那些 只 有 很 少 的 寄存 器 ， 或 者 寄存 器 很 没有 规律 的 机 器 上 实现 
Java 更 便利 ，Intel80X86 就 是 一 个 例子 。 由 于 指令 集 具有 这 种 以 栈 为 中 心 的 特征 ， 所 以 在 
很 多 平台 体系 结构 上 都 很 容易 实现 Java 虚拟 机 。 

Java 以 栈 为 中 心 设计 指令 集 的 另 一 个 动机 是 ， 编 译 器 一 般 采 用 以 栈 为 基础 的 结构 向 连 
接 器 或 优化 器 传递 编译 的 中 间 结 果 。Javaclass 文件 在 很 多 方面 都 和 C 编译 器 产生 的 o 文件 
或 者 .obj 文件 很 相似 ， 实 际 上 它 表 示 了 一 种 Java 程序 的 中 间 编 译 结果 形式 。 对 于 Java 的 情 
况 来 ， 虚 拟 机 是 作为 (动态 ) 连 接 器 使 用 的 ， 也 可 以 作为 优化 器 。 在 Java 虚拟 机 指令 集 设计 
中 ， 以 栈 为 中 心 的 体系 结构 可 以 将 运行 时 进行 的 优化 工作 与 执行 即时 编译 或 者 自 适 应 优化 
的 执行 引擎 结合 起 来 。 

在 第 4 章 中 讲 过 ， 设 计 中 一 个 主要 考虑 因素 是 class 文件 的 紧凑 性 。 紧 凑 性 对 于 提高 
在 网 络 上 传递 class 文件 的 速度 是 很 重要 的 。 在 class 文件 中 保存 的 字 节 码 ， 除 了 两 个 处 理 
表 跳 转 的 指令 之 外 ， 都 是 按照 字 节 对 齐 的 。 操 作 码 的 总 数 很 小 ， 所 以 操作 码 可 以 只 占据 一 
个 字 节 。 这 种 设计 策略 有 助 于 class 文件 的 紧凑 ， 但 却 是 以 可 能 影响 程序 运行 的 性 能 为 代 
价 的 。 某 些 Java 虚拟 机 实现 ， 特 别 是 那些 在 芯片 上 执行 字 节 码 的 实现 ， 但 字 节 的 操作 码 可 
能 使 得 一 些 可 以 提高 性 能 的 优化 无 法 实现 。 同 样 ， 假 若 字 节 码 流 是 以 字 对 齐 而 非 字 节 对 齐 
的 话 ， 某 些 实现 可 能 会 得 到 更 好 的 性 能 。 实 现 可 以 重新 对 齐 字 节 码 流 ， 或 者 在 装载 类 的 时 
候 把 操作 码 转换 成 更 加 有 效 的 形式 。 字 节 码 在 class 文件 中 是 按 字 节 对 齐 的 ， 在 抽象 方法 
区 和 执行 引擎 的 规范 中 也 是 这 么 规定 的 。 不 同 的 具体 实现 可 以 用 它们 喜欢 的 任何 形式 保存 
装载 后 的 字 节 码 流 。 

指导 指令 集 设 计 的 另 一 个 目标 就 是 进行 字 节 码 验证 的 能 力 ， 特 别 是 使 用 数据 流 分 析 器 
进行 的 一 次 性 验证 。Java 的 安全 框架 需要 这 种 验证 能 力 。 在 装载 字 节 码 的 时 候 使 用 数据 流 
分 析 器 进行 一 次 性 验证 ， 而 非 在 执行 每 条 指令 的 时 候 进 行 验证 ， 这 样 做 有 助 于 提高 执行 速 
度 。 在 指令 集中 体现 这 个 目标 的 表现 之 一 ， 就 是 绝 大 部 分 操作 码 都 指明 了 它们 需要 操作 的 
类 型 。 

比如 说 ， 不 是 简单 地 采用 一 条 指令 (该 指令 从 操作 数 栈 中 取出 一 个 字 并 保存 到 局 部 变量 
中 )，Java 虚拟 机 的 指令 集 而 是 采用 两 条 指令 。 一 条 指令 是 store 一 一 弹出 并 保存 int 类 型 ; 
另 一 条 指令 是 fstore 一 一 弹出 并 保存 float 类 型 。 在 执行 的 时 候 这 两 条 指令 所 完成 的 功能 是 
完全 一 致 的 ， 弹 出 一 个 字 并 保存 。 要 区 分 弹出 并 保存 的 到 底 是 int 类 型 还 是 float 类 型 ， 只 
对 验证 过 程 有 重要 作用 。 

对 于 某 些 指 令 ， 虚 拟 机 需要 知道 被 操作 的 类 型 ， 以 决定 如 果 执 行 操作 。 比 如 ，Java 虚 
拟 机 支持 两 种 把 两 个 字 加 起 来 并 得 到 一 个 结果 字 的 操作 。 一 种 是 把 字 当 作 int 处 理 ， 另 一 
种 是 把 字 当 作 float 处 理 。 这 两 条 指令 的 区 别 在 于 方便 验证 ， 同 时 也 告诉 虚拟 机 需要 的 是 整 
数 操作 ， 还 是 浮 点 数 操作 。 

有 一 些 指令 可 以 操作 任何 类 型 。 比 如 说 dup 指令 ， 不 管 栈 顶 的 字 是 什么 类 型 都 可 以 复 
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制 它 。 还 有 一 些 指令 不 操作 有 类 型 的 值 ， 比 如 goto。 但 是 大 部 分 指令 都 操作 特定 的 类 型 。 
这 种 “有 类 型 ”的 指令 ， 可 以 使 用 助 记 符 通 过 一 个 字符 前 缀 来 表明 它们 操作 的 类 型 。 表 5-1 
中 列举 了 不 同类 型 的 前 级 。 有 一 些 指 令 不 包含 前 级 ， 比 如 arraylength 或 instanceof， 因 为 他 
们 的 类 型 是 再 明显 不 过 的 。arraylength 操作 码 需 要 一 个 数组 引用 。instanceof 操作 码 需 要 一 
个 对 象 引 用 。 


表 5-1 字 节 码 助 记 符 的 前 缀 


类 型 代 码 描 述 
从 数组 装载 byte 类 型 
sastore 将 short 类 型 存 入 数组 中 
es 从 局 部 变量 1 中 装载 nt 类 型 
比较 long 类 型 值 


b 
S 
时 
1 mp 
i 把 int 类 型 数据 转换 为 char 类 型 
人 
d 
a 


| moad | 从 局 部 变量 中 装载 float 类 型 
| aconst1 | 


double 将 double 类 型 常量 1.0 压 入 栈 


reference 从 数组 装载 引用 类 型 


操作 数 栈 中 的 数值 必须 按照 适合 它们 类 型 的 方式 使 用 。 比 如 说 压 入 4 个 int， 但 却 把 它 
们 当 作 两 个 long 来 做 加 法 ， 这 是 非法 的 。 把 一 个 float 值 从 局 部 变量 压 入 操作 数 栈 ， 然 后 
把 它 作 为 int 保存 到 堆 中 的 数组 中 去 ， 这 也 是 非法 的 。 从 一 个 位 于 堆 中 的 对 象 字段 压 入 一 
个 double 值 ， 然 后 把 栈 中 最 顶端 的 两 个 字 作为 类 型 引用 保存 到 局 部 变量 ， 这 也 是 非法 的 。 
Java 编译 器 所 坚持 的 强 类 型 规则 对 Java 虚拟 机 实现 同样 也 是 适用 的 。 

当 执 行 那 些 与 类 型 无 关 的 一 般 性 栈 操作 指令 时 ， 实 现 也 必须 遵守 一 些 规 则 。 前 面 讲 
过 ， 不 管 是 什么 类 型 ，dup 指令 压 入 栈 中 顶端 那个 字 的 拷贝 。 这 条 指令 可 以 用 在 任何 占据 
一 个 字 的 值 类 型 上 ， 如 intflot、 引 用 或 其 他 的 返回 类 型 。 但 是 ， 如 果 栈 顶 包 含 的 是 long 或 
者 double 类 型 ， 它 们 占据 了 两 个 连续 的 栈 空 间 ， 这 时 使 用 dup 就 是 非法 的 。 位 于 栈 顶 的 
long 或 者 double 需要 用 dup2 指令 复制 两 个 字 ， 在 操作 数 栈 中 压 入 栈 项 的 两 个 字 的 拷贝 。 
一 般 性 指令 不 能 用 来 切割 双 字 值 。 

为 了 使 指令 集 足 够 小 ， 用 单字 节 表 示 每 一 个 操作 码 ， 但 并 不 是 在 所 有 类 型 上 都 支持 所 
有 的 操作 。 很 多 操作 对 byte、short 和 char 都 不 支持 。 这 些 类 型 在 从 堆 或 者 方法 区 转移 到 
栈 帧 的 时 候 被 转换 成 int， 当 它们 被 当 作 int 来 进行 操作 ， 然 后 在 操作 完成 后 重新 保存 到 堆 
或 方法 去 的 时 候 ， 再 转换 为 byte、short 或 者 char。 

表 5-2 展示 了 Java 虚拟 机 中 保存 的 每 个 类 型 所 对 应 的 计算 类 型 。 这 里 ， 保 存 类 型 是 堆 
中 类 型 值 所 体现 的 形式 。 保 存 类 型 对 应 Java 源 代 码 中 变量 的 类 型 。 计 算 类 型 是 这 些 类 型 在 
Java 栈 帧 中 体现 的 形式 。 


表 5-2 Java 虚拟 机 中 的 保存 类 型 和 计算 类 型 
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二 于 权衡 优化 、 高 效 和 安全 的 最 优 方案 
续 表 
保存 类 型 堆 或 者 方法 区 中 的 最 小 比特 数 Java 栈 帧 中 的 字 长 
int 32 E 
long 64 2 
char 16 1 
float 32 1 
double 64 2 
reference 32 1 
基本 类 型 终结 符 如 表 5-3 所 示 。 


表 5-3 基本 类 型 终结 和 


终结 符 类 型 

B byte 

EC char 

D double 

下 float 

I int 

J long 

S short 

乙 boolean 


Java 虚拟 机 实现 必须 以 某 种 方法 确保 数值 是 被 对 应 其 类 型 的 指令 所 操作 的 。 实 现 可 以 
在 类 验证 过 程 中 就 预先 验证 字 节 码 ， 或 者 在 执行 的 时 候 验 证 ， 或 者 采用 前 两 种 验证 方式 的 
混合 方式 。 

在 具体 实现 时 可 以 使 用 多 种 执行 技术 : 解释 、 即 时 编译 、 自 适应 优化 、 芯 片 级 直接 执 
行 。 关 于 执行 技术 要 记 住 的 最 主要 的 一 点 就 是 ， 实 现 可 以 自由 选择 任何 技术 来 执行 字 节 
码 ， 只 要 它 遵 守 Java 虚拟 机 指令 集 的 定义 。 

最 有 意义 也 是 最 迅速 的 执行 技术 之 一 是 自 适应 优化 。 自 适应 优化 已 经 在 几 种 现 有 的 
Java 虚拟 机 实现 中 使 用 了 ， 如 Sun 的 Hotspot 虚拟 机 。 它 们 都 从 早期 虚拟 机 实现 所 使 用 的 
技术 中 得 到 了 很 多 借鉴 。 最 初 的 虚拟 机 每 次 解释 一 条 字 节 码 ; 第 二 代 虚 拟 机 加 入 了 即时 编 
译 器 ， 在 第 一 次 执行 方法 的 时 候 先 编译 本 地 代码 ， 然 后 执行 这 段 本 地 代码 。 也 就 是 说 ， 不 
管 什么 时 候 调 用 方法 ， 总 是 执行 本 地 代码 。 自 适应 优化 器 搜集 那些 只 在 运行 时 才 有 效 的 信 
息 ， 试 图 以 某 种 方式 把 字 节 码 解释 和 编译 成 本 地 代码 结合 起 来 ， 以 得 到 最 优化 的 性 能 。 

自 适应 优化 的 虚拟 机 开始 的 时 候 对 所 有 的 代码 都 是 解释 运行 ， 但 是 它 会 监视 代码 的 执 
行情 况 。 大 多 数 程序 花费 80% 一 90% 的 时 间 用 来 执行 10% 一 20% 的 代码 ， 它 们 占 整 个 执行 
时 间 的 80%6 一 90%6。 

当 自 适应 优化 的 虚拟 机 判断 出 某 个 特定 的 方法 是 瓶颈 的 时 候 ， 它 启动 一 个 后 台 线程 ， 
把 字 节 码 编译 成 本 地 代码 ， 非 常 仔细 地 优化 这 些 本 地 代码 。 同 时 ， 程 序 仍然 通过 解释 来 执 
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行 字 节 码 。 因 为 程序 没有 中 途 挂 起 ， 并 且 只 编译 和 优化 那些 “ 热 区 ”虚拟 机 可 以 比 传统 的 
即时 编译 更 注重 优化 性 能 。 

自 适应 优化 技术 使 程序 最 终 能 把 原来 占 80% 一 90% 运 行 时 间 的 代码 变 为 极度 优化 的 ， 
静态 链接 的 C++ 本 地 代码 ， 而 使 用 的 总 内 存 数 并 不 比 全 部 解释 Java 程序 大 多 少 。 换 句 话 
说 ， 就 是 更 快 了 。 自 适应 优化 的 虚拟 机 可 以 保留 原来 的 字 节 码 ， 等 待 方法 从 热 区 移出 (程序 
的 热 区 在 执行 的 过 程 中 可 能 会 转移 )。 当 方法 变 得 不 再 是 热 区 的 时 候 ， 取 消 那些 编译 过 的 代 
码 ， 重 新 开始 解释 执行 那些 字 节 码 。 

读者 可 能 会 注意 到 ， 自 适应 优化 方法 令 Java 程序 运行 得 更 快 ， 它 采取 的 办 法 和 程序 员 
用 来 提高 程序 性 能 的 方法 是 很 相似 的 。 不 同 于 通常 的 即时 编译 虚拟 机 ， 自 适应 优化 的 虚拟 
机 并 不 进行 “过 早 的 优化 ”。 自 适应 优化 的 虚拟 机 通过 解释 执行 字 节 码 开 始 ， 当 程序 运行 
的 时 候 ， 虚 拟 机 统计 程序 ， 找 到 程序 的 热 区 一 一 就 是 那 10% 一 20% 的 代码 ， 它 们 花费 了 
80% 一 90% 的 运行 时 间 。 就 如 同一 个 优秀 的 程序 员 那 样 ， 自 适应 优化 的 虚拟 机 只 对 那些 对 
性 能 产生 重大 影响 的 代码 进行 仔细 优化 。 

但 是 自 适应 优化 的 情况 不 止 这 些 ， 它 还 有 另外 的 着 眼 点 。 自 适应 优化 器 可 以 在 运行 
时 根据 Java 程序 的 特征 进行 微调 一 一 特别 是 对 “设计 良好 ”的 Java 程序 。 根 据 
JavaSoftHotspot 的 经 历 DavidGriswold 的 说 法 ，“Java 比 C++ 更 加 面向 对 象 。 你 可 以 测量 
它 ， 可 以 发 现 方法 调用 的 频 度 、 动 态 派 发 的 频 度 ， 等 等 。 这 些 频 度 要 比 C++ 中 高 的 多 ”。 
现在 ， 在 一 个 设计 良好 的 Java 程序 中 ， 这 种 方法 调用 和 动态 派发 的 频 度 更 加 高 了 ， 因 为 
Java 程序 良好 设计 的 尺度 之 一 就 是 高 效率 、 高 产 出 的 设计 一 一 换 句 话 就 是 ， 使 方法 和 对 象 
更 紧凑 及 内 聚 性 更 高 。 

这 些 Java 程序 的 运行 时 特征 ， 就 是 方法 调用 和 动态 派发 的 高 频 度 发 生 ， 它 们 从 两 个 方 
面 影响 性 能 。 首 先 ， 每 次 动态 派发 都 会 产生 相关 的 管理 费用 ， 其 次 ， 更 重要 的 是 方法 调用 
降低 了 编译 器 优化 的 有 效 性 。 

方法 调用 会 使 优化 器 的 有 效 性 降低 ， 因 为 优化 器 在 不 同 的 方法 调用 间 不 能 够 有 效 地 工 
作 ， 因 此 优化 器 在 方法 调用 的 时 候 就 无 法 专注 于 代码 了 。 方 法 调用 频 度 越 高 ， 方 法 调用 之 
间 可 以 用 来 优化 的 代码 就 越 少 ， 优 化 器 就 变 得 越 低 效 。 

这 个 问题 的 标准 解决 方案 就 是 内 嵌 一 一 把 被 调用 方法 的 方法 体 直接 拷贝 到 发 起 调用 的 
方法 中 。 内 嵌 调 出 了 方法 调用 ， 因 此 可 以 让 优化 器 处 理 更 多 的 代码 。 这 可 能 令 优 化 器 工作 
更 有 效 ， 代 价 就 需要 更 多 的 运行 时 内 存 。 

麻烦 之 处 在 于 ， 在 面向 对 象 的 语言 (比如 Java 和 C++H) 中 实现 内 嵌 ， 要 比 非 面向 对 象 的 
语言 (比如 C) 更 加 困难 ， 因 为 面向 对 象 语言 使 用 了 动态 派发 。 在 Java 中 比 在 C++ 中 更 加 严 
重 ， 因 为 Java 的 方法 调用 和 动态 派发 的 频 度 要 比 C++ 高 得 多 。 

一 个 C 程序 的 标准 优化 静态 编译 器 可 以 直接 使 用 内 典 ， 因 为 每 一 个 函数 调用 都 有 一 个 
函数 实现 。 对 于 面向 对 象 语言 来 说 ， 内 垦 就 变 得 复杂 了 ， 因 为 动态 方法 派发 以 一 个 函数 调 
用 可 能 有 多 个 函数 实现 (方法 )。 换 名 话说， 虚拟 机 运行 时 根据 方法 调用 的 对 象 类 ， 可 能 会 
有 很 多 不 同 的 方法 实现 可 供 选 择 。 

内 嵌 一 个 动态 派发 的 方法 调用 ， 一 种 解决 办 法 就 是 把 所 有 可 能 在 运行 时 被 选择 的 方法 
实现 都 内 嵌 进 去 ， 这 种 思路 的 问题 在 于 ， 如 果 有 很 多 方法 实现 ， 就 会 让 优化 后 的 代码 变 得 
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非常 大 。 

自 适应 编译 比 静 态 编译 的 优点 在 于 ， 因 为 它 是 在 运行 时 工作 的 ， 它 可 以 使 用 静态 编译 
器 所 无 法 得 到 的 信息 。 比 如 说 ， 对 于 一 个 特定 的 方法 调用 ， 就 算 有 30 个 可 能 的 方法 实 
现 ， 运 行 时 可 能 只 会 有 其 中 的 两 个 被 调用 。 自 适应 方法 就 可 以 只 把 这 两 个 方法 内 能 ， 有 效 
地 减少 过 了 优化 后 的 代码 大 小 。 

线程 Java 虚拟 机 规范 定义 了 线程 模型 ， 这 个 模型 的 目标 是 要 有 助 于 在 很 多 体系 结构 
上 都 实现 它 。Java 线程 模型 的 一 个 目标 就 是 使 实现 的 设计 者 ， 在 可 能 的 情况 下 使 用 本 地 线 
程 。 和 否则 ， 设 计 者 可 以 在 他 们 的 虚拟 机 实现 内 部 实现 线程 机 制 。 在 一 台 多 处 理 器 的 主机 上 
使 用 本 地 线程 的 好 处 就 是 ，Java 程序 不 同 的 线程 可 以 在 不 同 的 处 理 器 上 并 行 工作 。 

Java 线程 模型 的 折 中 之 一 就 是 优先 级 的 规范 考虑 最 小 公分 母 问题 。Java 线程 可 以 运行 
于 10 个 优先 级 的 任何 一 个 。 级 别 1 是 优先 级 最 低 的 ， 而 级 别 10 是 最 高 的 。 如 果 设 计 者 使 
用 本 地 线程 ， 他 可 以 用 合适 的 方法 把 10 个 Java 优先 级 映射 到 机 器 本 地 的 优先 级 上 。Java 
虚拟 机 规范 对 于 不 同 优先 级 别 的 线程 行为 ， 只 规定 了 所 有 高 优先 级 的 线程 会 得 到 大 多 数 的 
CPU 时 间 。 低 级 别 的 线程 在 级 别 高 的 线程 没有 被 阻塞 的 时 候 也 可 能 得 到 CPU 时 间 ， 但 是 
这 没有 任何 保证 。 

规范 没有 假设 不 同 优先 级 的 线程 采用 时 间 分 片 方式 。 因 为 并 不 是 所 有 的 体系 结构 都 采 
用 时 间 片 (在 这 里 ， 时 间 分 片 的 含义 是 : 就 算 没有 线程 被 阻塞 ， 所 有 优先 级 的 所 有 线程 都 会 
保证 得 到 一 些 CPU 时 间 )。 就 算 在 那些 采用 时 间 片 的 体系 结构 上 ， 用 来 分 配 时 间 片 给 不 同 
优先 级 线程 的 算法 也 存在 非常 大 的 差异 。 

我 们 知道 ， 程 序 的 正确 运行 不 能 依靠 时 间 分 片 。 只 有 在 向 Java 虚拟 机 给 出 提示 ， 某 个 
线程 应 该 比 其 他 线程 使 用 更 多 的 时 间 ， 这 时 候 才 使 用 线程 优先 级 。 要 协调 多 线程 之 间 的 活 
动 ， 应 该 使 用 同步 。 

任何 Java 虚拟 机 的 线程 实现 都 必须 支持 同步 的 两 个 方面 : 对 象 锁定 、 线 程 等 待 和 通 
知 。 对 象 锁定 使 独立 运行 的 线程 访问 共享 数据 的 时 候 互 斥 。 线 程 等 待 和 通知 使 得 线程 为 了 
达到 同一 个 目标 而 互相 协同 工作 。 运 行 中 的 程序 通过 Java 虚拟 机 指令 集 来 访问 上 锁 机 制 ， 
还 通过 Object 类 的 wait() 方 法 、notify() 方 法 和 notifyAll() 方 法 来 访问 线程 等 待 和 通知 
机 制 。 

在 Java 虚拟 机 规范 中 ，Java 线程 的 行为 是 通过 术语 一 一 变量 、 内 存 和 工作 内 存 一 一 来 
定义 的 。 每 一 个 Java 虚拟 机 实例 都 有 一 个 主 存 ， 用 于 保存 所 有 的 程序 变量 (对 象 的 实例 变 
量 、 数 组 的 元 素 以 及 类 变量 )。 每 一 个 线程 都 有 一 个 工作 内 存 ， 线 程 用 它 保存 所 使 用 和 赋值 
的 变量 的 “工作 拷贝 ”， 局 部 变量 和 参数 ， 因 为 他 们 是 每 个 线程 私有 的 ， 可 以 从 逻辑 上 看 
成 是 工作 内 存 或 者 主 存 的 一 部 分 。 

Java 虚拟 机 规范 定义 了 许多 规则 ， 用 来 管理 线程 和 主 存 之 间 的 额 低层 交互 行为 。 比 
如 ， 一 条 规则 声明 : 所 有 对 基本 类 型 的 操作 ， 除 了 某 些 对 long 类 型 和 double 类 型 的 操作 
之 外 ， 都 必须 是 源 自 级 的 。 再 比如 ， 如 果 两 个 线程 竞争 ， 对 一 个 int 变量 写 了 不 同 的 两 个 
值 ， 就 算 不 存在 同步 ， 变 量 最 终 会 采用 二 者 之 一 。 变 量 不 会 包含 一 个 不 正确 的 值 。 或 者 
说 ， 如 果 一 个 线程 赢得 了 竞争 ， 把 它 要 写 的 值 先 写 入 到 了 变量 。 但 失败 的 那个 线程 也 可 以 
重 写 那 个 变量 ， 覆 盖 那 个 以 为 自己 “胜利 ”的 线程 所 写 入 的 值 。 
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这 条 规则 也 有 例外 情况 ， 即 任何 没有 生命 为 volatile 的 long 或 者 double 变量 。 某 些 实 
现 可 能 把 它们 作为 两 个 原子 性 的 32 位 值 对待 ， 而 非 一 个 原子 性 的 64 位 值 。 比 如 说 ， 把 一 
个 非 volatile 的 long 保存 到 内 存 ， 可 能 是 两 次 32 位 的 写 操作 。 这 种 对 于 long 和 double 的 
非 原 子 操作 可 能 导致 两 个 竞争 性 的 线程 在 试图 写 入 不 同 的 值 到 一 个 long 或 者 double 变量 
时 ， 最 终 得 到 的 是 一 个 不 正确 的 结果 。 

虽然 实现 的 设计 者 不 是 必须 对 非 volatile 的 long 和 double 进行 原子 处 理 ， 但 Java 虚拟 
机 规范 鼓励 他 们 这 么 做 。 这 种 对 long 和 double 的 非 源 自 操 作 ， 对 那 条 “对 所 有 基本 类 型 
的 操作 都 必须 是 原子 级 的 ”的 规则 而 言 ， 就 是 一 个 例外 ， 这 个 例外 的 目的 是 ， 如 果 处 理 器 
不 有 效 的 支持 和 内 存 交 换 64 位 的 值 ， 线 程 模型 也 能 经 济 的 实现 。 将 来 这 个 例外 可 能 被 终 
止 。 然 而 现在 ，Java 程序 员 必 须 确保 通过 同步 来 操作 共享 的 long 和 double。 

基本 上 ， 管 理 低层 线程 行为 的 规则 ， 规 定 了 一 个 线程 何 时 可 以 做 及 何 时 必须 做 以 下 的 
事情 : 

口 ”把 变量 的 值 从 主 存 复制 到 它 的 工作 内 存 。 

口 ”把 值 从 它 的 工作 内 存 写 回 到 主 存 。 

在 特定 条 件 下 ， 规 则 指定 了 精确 的 和 可 预言 的 读 写 内 存 的 顺序 。 然 而 另外 一 些 条 件 
下 ， 规 则 没有 规定 任何 顺序 。 规 则 ， 是 设计 来 让 Java 程序 员 利 用 可 以 预期 的 行为 建立 多 线 
程 程序 ， 而 给 实现 的 设计 者 更 多 的 灵活 性 。 这 种 灵活 性 使 Java 虚拟 机 实现 的 设计 者 从 标准 
硬件 和 软件 技术 中 得 到 好 处 ， 它 们 可 以 提高 多 线程 程序 的 性 能 。 

所 有 管理 线程 行为 的 低层 规则 的 高 层 含义 是 : 如 果 访 问 某 个 没有 被 同步 的 变量 ， 人 允许 
线程 用 任何 顺序 来 更 新 主 存 。 不 使 用 同步 ， 多 线程 程序 可 能 在 某 些 Java 虚拟 机 实现 上 表现 
出 令 人 惊讶 的 行为 。 但 是 通过 正确 的 使 用 同步 ， 可 以 创建 多 线程 的 Java 程序 ， 它 们 按照 可 
以 预期 的 方式 ， 可 以 在 任何 Java 虚拟 机 上 工作 。 


5.3.11 本 地 方法 接口 


并 不 强求 Java 虚拟 机 实现 支持 任何 特定 的 本 地 方法 接口 。 有 些 实现 可 以 根本 不 支持 本 
地 方法 接口 ， 还 有 一 些 可 能 支持 少数 几 个 ， 每 一 个 对 应 一 种 不 同 的 需求 。 

Sun 的 Java 本 地 接口 ， 或 者 成 为 INI， 是 为 可 移植 性 准备 的 。JNI 设计 的 可 以 被 任何 
Java 虚拟 机 实现 支持 ， 而 不 管 它们 使 用 何 种 垃圾 洲际 或 者 对 象 表示 技术 。 这 样 它 能 使 开发 
者 在 一 个 特定 的 主机 平台 上 ， 把 同样 的 (与 JNI 兼容 的 ) 本 地 方法 二 进 制 形式 连接 到 任何 支 
持 JNI 的 虚拟 机 实现 上 。 

实现 设计 者 可 以 选择 创建 一 些 私 有 的 本 地 方法 接口 ， 扩 展 或 者 取代 JNI。 为 了 实现 可 
移植 性 ，JNI 在 指针 和 指针 之 间 ， 指 针 和 方法 之 间 使 用 了 很 多 间接 方法 。 为 了 得 到 最 好 的 
性 能 ， 实 现 设计 者 可 以 提供 他 们 自己 的 低层 本 地 方法 接口 ， 以 便 和 他 们 所 使 用 的 特定 实现 
结构 能 更 加 紧密 地 结合 。 设 计 者 也 可 以 提供 比 JNI 更 能 高 层 的 本 地 方法 接口 ， 比 如 把 Java 
对 象 加 入 到 一 种 组 建 软件 模型 中 。 

为 了 做 好 工作 ， 本 地 方法 必须 能 够 和 Java 虚拟 机 实例 的 某 些 内 部 状态 有 某 种 程度 的 交 
互 。 比 如 ， 本 地 方法 接口 允许 本 地 方法 完成 下 列 部 分 或 全 部 工作 : 

口 ”传递 或 返回 数据 。 
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操作 实例 变量 或 者 调用 使 用 垃圾 收集 的 堆 中 的 对 象 的 方法 。 
操作 类 变量 或 者 调用 类 方法 。 
操作 数组 。 
对 堆 中 的 对 象 加 锁 ， 以 便 被 当前 线程 独占 使 用 。 
在 使 用 垃圾 收集 的 堆 中 创建 新 的 对 象 。 
装载 新 的 类 。 
抛 出 新 的 异常 。 
捕获 本 地 方法 调用 的 Java 方法 抛 出 的 异常 。 
捕获 虚拟 机 抛 出 的 异步 异常 。 
口 “指示 垃圾 收集 器 某 个 对 象 不 再 需要 。 
设计 一 个 提供 这 些 服务 的 本 地 方法 接口 是 非常 复杂 的 ， 需 要 确认 垃圾 收集 器 没有 释放 
那些 正在 被 本 地 方法 使 用 的 对 象 。 如 果实 现 的 垃圾 收集 器 为 了 减少 堆 碎 片 移动 了 一 个 对 
象 ， 本 地 方法 设计 必须 保证 下 面 二 者 之 一 : 
口 ” 当 对 象 的 引用 被 传递 给 了 一 个 本 地 方法 之 后 ， 它 可 以 移动 。 
口 ”任何 其 引用 传递 给 了 本 地 方法 的 对 象 都 被 钉 住 ， 直 到 本 地 方法 返回 ， 或 者 它 表明 
自己 已 经 完成 了 对 象 的 操作 。 
由 此 可 见 ， 本 地 方法 接口 和 Java 虚拟 机 内 部 工作 纠缠 在 了 一 起 。 
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Java 对 象 的 生命 周期 大 致 包括 三 个 阶段 : 对 象 的 创建 、 对 象 的 使 用 、 对 象 的 清除 。 因 
此 ， 对 象 的 生命 周期 长 度 可 用 如 下 的 表达 式 表 示 : T = Tl + T2 +T3。 其 中 Tl 表示 对 象 的 
创建 时 间 ，T2 表示 对 象 的 使 用 时 间 ， 而 T3 则 表示 其 清除 时 间 。 由 此 ， 我 们 可 以 看 出 ， 只 
有 T2 是 真正 有 效 的 时 间 ， 而 T1、T3 则 是 对 象 本 身 的 开销 。 下 面 再 看 看 T1、T3 在 对 象 的 
整个 生命 周期 中 所 占 的 比例 。 

众所周知 ，Java 对 象 是 通过 构造 函数 来 创建 的 ， 在 这 一 过 程 中 ， 该 构造 函数 链 中 的 所 
有 构造 函数 也 都 会 被 自动 调用 。 另 外 在 默认 情况 下 ， 当 调用 类 的 构造 函数 时 ，Java 会 把 变 
量 初始 化 成 确定 的 值 : 所 有 的 对 象 被 设置 成 null， 整 数 变量 (byte、short、int、long) 设 置 成 
0，float 和 double 变量 设置 成 0.0， 逻 辑 值 设置 成 false。 所 以 用 new 关键 字 来 新 建 一 个 对 
象 的 时 间 开 销 是 很 大 的 ， 如 表 5-4 所 示 。 


表 5-4 一 些 操作 所 耗费 时 间 的 对 照 表 


运算 操作 标准 化 时 间 
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从 表 5-4 中 可 以 看 出 ， 新 建 一 个 对 象 需要 980 个 单位 的 时 间 ， 是 本 地 赋值 时 间 的 980 
倍 ， 是 方法 调用 时 间 的 166 倍 ， 而 若 新 建 一 个 数组 所 花费 的 时 间 就 更 多 了 。 再 看 清除 对 象 
的 过 程 。 我 们 知道 ，Java 语言 的 一 个 优势 是 Java 程序 员 无 须 再 像 C/C++ 程序 员 那 样 ， 显 式 
地 释放 对 象 ， 而 由 称 为 垃圾 收集 器 (Garbage Collector) 的 自动 内 存 管 理 系 统 ， 定 时 或 在 内 存 
凸现 出 不 足 时 ， 自 动 回收 垃圾 对 象 所 占 的 内 存 。 凡 事 有 利 总 也 有 次， 这 虽然 为 Java 程序 设 
计 者 提供 了 方便 ， 但 同时 它 也 带 来 了 较 大 的 性 能 开销 。 这 种 开销 包括 两 方面 ， 首 先是 对 象 
管理 开销 ，GC 为 了 能 够 正确 释放 对 象 ， 它 必须 监控 每 一 个 对 象 的 运行 状态 ， 包 括 对 象 的 
申请 、 引 用 、 被 引用 、 赋 值 等 。 其 次 ， 在 GC 开始 回收 “垃圾 ”对 象 时 ， 系 统 会 暂停 应 用 
程序 的 执行 ， 而 独自 占用 CPU。 

因此 ， 如 果 要 改善 应 用 程序 的 性 能 ， 一 方面 应 尽量 减少 创建 新 对 象 的 次 数 ， 同时， 还 
应 尽量 减少 TI、T3 的 时 间 ， 而 这 些 均 可 以 通过 对 象 池 技 术 来 实现 。 


5.4.1 对象 池 技术 的 基本 原理 


对 象 池 技术 基本 原理 的 核心 有 两 点 ， 分 别 是 缓存 和 共享 ， 即 对 于 那些 被 频繁 使 用 的 对 
象 ， 在 使 用 完 后 ， 不 立即 将 它们 释放 ， 而 是 将 它们 缓存 起 来 ， 以 供 后 续 的 应 用 程序 重复 使 
用 ， 从 而 减少 创建 对 象 和 释放 对 象 的 次 数 ， 进 而 改善 应 用 程序 的 性 能 。 事 实 上 ， 由 于 对 象 
池 技 术 将 对 象限 制 在 一 定 的 数量 ， 也 有 效 地 减少 了 应 用 程序 内 存 上 的 开销 。 

在 实现 一 个 对 象 池 时 ， 一 般 会 涉及 如 下 所 示 的 类 。 

1) 对 象 池 工厂 (ObjectPoolFactory) 类 

该 类 主要 用 于 管理 相同 类 型 和 设置 的 对 象 池 (ObjectPool)， 它 一 般 包含 如 下 两 个 方法 : 

口 createPool: 用 于 创建 特定 类 型 和 设置 的 对 象 池 ; 

口 ”destroyPool: 用 于 释放 指定 的 对 象 池 。 

同时 为 了 保证 ObjectPoolFactory 的 单一 实例 ， 可 以 采用 Singleton 设计 模式 ， 见 下 述 
getInstance 方法 的 实现 : 

public static ObjectPoolFactory getInstance() { 
if (poolFactory == null) { 

poolFactory = new ObjectPoolFactory(); 

} 

return poolFactory; 
} 


2) 参数 对 象 (ParameterObject) 类 

该 类 主要 用 于 封装 所 创建 对 象 池 的 一 些 属性 参数 ， 如 池 中 可 存放 对 象 的 数目 的 最 大 值 
(maxCount)、 最 小 值 (minCount) 等 。 

3) 对 象 池 (ObjectPooD) 类 

用 于 管理 要 被 池 化 对 象 的 借 出 和 归还 ， 并 通知 PoolableObjectFactory 完成 相应 的 工 
作 。 它 一 般 包含 如 下 两 个 方法 : 

口 ”getObject; 用 于 从 池 中 借 出 对 象 ; 

口 retumObject: 将 池 化 对 象 返回 到 池 中 ， 并 通知 所 有 处 于 等 待 状态 的 线程 。 
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4) 池 化 对 象 工厂 (PoolableObjectFactory) 类 
该 类 主要 负责 管理 池 化 对 象 的 生命 周期 ， 就 简单 来 说 ， 一 般 包 括 对 象 的 创建 及 销毁 。 
该 类 同 ObjectPoolFactory 一 样 ， 也 可 将 其 实现 为 单 实例 。 


5.4.2 通用 对 象 池 的 实现 


对 象 池 的 构造 和 管理 可 以 按照 多 种 方式 实现 。 最 灵活 的 方式 是 将 池 化 对 象 的 Class 类 
型 在 对 象 池 之 外 指定 ， 即 在 ObjectPoolFactory 类 创建 对 象 池 时 ， 动 态 指定 该 对 象 池 所 池 化 
对 象 的 Class 类 型 ， 其 实现 代码 如 下 : 


public ObjectPool createPool (ParameterObject paraobj,Class clsType) { 
return new ObjectPool (paraOobj, clsType); 
| 


其 中 ，paraObj 参数 用 于 指定 对 象 池 的 特征 属性 ，clsType 参数 则 指定 了 该 对 象 池 所 存 
放 对 象 的 类 型 。 对 象 池 (ObjectPool) 创 建 以 后 ， 下 面 就 是 利用 它 来 管理 对 象 了 ， 具 体 实现 
如 下 : 


public class ObjectPool { 
private Parameterobject paraobj;// 该 对 象 池 的 属性 参数 对 象 
Private Class clsType;// 该 对 象 池 中 所 存放 对 象 的 类 型 
private int currentNum = 0; // 该 对 象 池 当 前 已 创建 的 对 象 数目 
private Object currentobj;// 该 对 象 池 当前 可 以 借 出 的 对 象 
private Vector pool;// 用 于 存放 对 象 的 池 
public ObjectPool (ParameterObject paraOb]j, Class clsType) { 
this.paraobj = paraObj; 
this.clsType = clsType; 
pool = new Vector(); 
} 
public Object getObject() { 
if (pool.size() <= paraObj.getMinCount()) { 
if (currentNum <= paraObj.getMaxCount()) { 
// 如 果 当 前 池 中 无 对 象 可 用 ， 而 且 已 创建 的 对 象 数目 小 于 所 限制 的 最 大 值 ， 就 利用 
//PoolobjectFactory 创建 一 个 新 的 对 象 
PoolableObjectFactory objFactory =PoolableobjectFactory.getInstance () 
CuUrrentobj = objFactory.create Object (clsType); 
currentNum++; 
} else { 
// 如 果 当 前 池 中 无 对 象 可 用 ， 而 且 所 创建 的 对 象 数目 己 达 到 所 限制 的 最 大 值 ， 
// 就 只 能 等 待 其 它 线程 返回 对 象 到 池 中 
synchronized (this) { 
try { 
Wait() > 
} catch (InterruptedException e) { 
System.out.println (e.getMessage ()); 
e.printstackTrace (); 
currentObj = pool.firstElement (); 
1 
} 
} else { 


// 如 果 当 前 池 中 有 可 用 的 对 象 ， 就 直接 从 池 中 取出 对 象 
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CuUrrentob]j = pool.firstElement () 7 
} 
return currentObj; 
} 
public void returnObject (Object obj) { 
// 确保 对 象 具 有 正确 的 类 型 
if (obj.isInstance(clsType)) { 
pool.addElement (obj); 
synchronized (this) { 
notifyAll (); 
} 
} else { 
throw new IllegalArgumentException ("该 对 象 池 不 能 存放 指定 的 对 象 类 型 ") ; 
和 
} 
} 


从 上 述 代 码 可 以 看 出 ，ObjectPool 利用 一 个 java.util.Vector 作为 可 扩展 的 对 象 池 ， 并 
通过 它 的 构造 函数 来 指定 池 化 对 象 的 Class 类 型 及 对 象 池 的 一 些 属性 。 在 有 对 象 返回 到 对 
象 池 时 ， 它 将 检查 对 象 的 类 型 是 否 正确 。 当 对 象 池 里 不 再 有 可 用 对 象 时 ， 它 或 者 等 待 已 被 
使 用 的 池 化 对 象 返回 池 中 ， 或 者 创建 一 个 新 的 对 象 实例 。 不 过 ， 新 对 象 实例 的 创建 并 不 在 
ObjectPool 类 中 ， 而 是 由 PoolableObjectFactory 类 的 createObject 方法 来 完成 的 ， 具 体 实现 
如 下 : 


public Object createObject (Class clsType) { 
Object obj = null; 

ey 

obj] = clsType.newInstance (); 

} catch (Exception e) { 

e.printstackTrace (); 

return obj; 


这 样 ， 通 用 对 象 池 的 实现 就 算 完成 了 ， 下 面 再 看 看 客户 端 (Client) 如 何 来 使 用 它 ， 假 定 
池 化 对 象 的 Class 类 型 为 StringBuffer: 


// 创 建 对 象 池 工 厂 

ObjectPoolFactory poolFactory = ObjectPoolFactory. getInstance (); 
// 定 义 所 创建 对 象 池 的 属性 

Parameterobject paraObj] = new ParameterObject (2,1); 

// 利 用 对 象 池 工厂 , 创建 一 个 存放 StringBuffer 类 型 对 象 的 对 象 池 

ObjectPool pool = poolFactory.createPool (paraObj, String Buffer.class) 
// 从 池 中 取出 一 个 StringBuffer 对 象 

StringBuffer buffer = (StringBuffer)pool.getobject():; 

// 使 用 从 池 中 取出 的 StringBuffer 对 象 

buffer.append ("hello"); 

System.out.println (buffer.tostring()); 


由 此 可 以 看 出 ， 通 用 对 象 池 使 用 起 来 还 是 很 方便 的 ， 不 仅 可 以 方便 地 避免 频繁 创建 对 
象 的 开销 ， 而 且 通 用 程度 高 。 但 遗憾 的 是 ， 由 于 需要 使 用 大 量 的 类 型 定型 (Casb 操 作 ， 再 
加 上 一 些 对 Vector 类 的 同步 操作 ， 使 得 它 在 某 些 情况 下 对 性 能 的 改进 非常 有 限 ， 尤 其 对 那 
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些 创建 周期 比较 短 的 对 象 。 


5.4.3 ”专用 对 象 池 的 实现 


由 于 通用 对 象 池 的 管理 开销 比较 大 ， 某 种 程度 上 抵消 了 重用 对 象 所 带 来 的 大 部 分 优 
势 。 为 解决 该 问题 ， 可 以 采用 专用 对 象 池 的 方法 。 即 对 象 池 所 池 化 对 象 的 Class 类 型 不 是 
动态 指定 的 ， 而 是 预先 就 已 指定 。 这 样 ， 它 在 实现 上 也 会 较 通用 对 象 池 简单 些 ， 可 以 不 要 
ObjectPoolFactory 和 PoolableObjectFactory 类 ， 而 将 它们 的 功能 直接 融合 到 ObjectPool 
类 ， 具 体 代码 如 下 。 

public class ObjectPool { 

private ParameterObject paraobj;// 该 对 象 池 的 属性 参数 对 象 

Private int currentNum = 0; // 该 对 象 池 当 前 已 创建 的 对 象 数目 

private StringBuffer currentobj;// 该 对 象 池 当前 可 以 借 出 的 对 象 

private Vector pool;// 用 于 存放 对 象 的 池 

public ObjectPool (ParameterObject paraob]j) { 

this.paraobj = paraObj; 

pool = new Vector(); 

} 

public StringBuffer getobject() { 

if (pool.size() <= paraObj.getMinCount()) { 
if (currentNum <= paraObj.getMaxCount()) { 
currentOb] = new StringBuffer(); 
currentNumt+; 

} 


} 
return currentObj; 


} 
public void returnobject (Object obj) { 
// 确保 对 象 具 有 正确 的 类 型 


if (StringBuffer.isInstance (obj)) { 
wb 
} 
在 上 述 代码 中 ， 假 设 被 池 化 对 象 的 Class 类 型 仍然 为 StringBuffer， 而 用 省 略 号 表示 的 
地 方 ， 表 示 代 码 同 通 用 对 象 池 的 实现 。 
在 Java 技术 中 ， 恰 当地 使 用 对 象 池 技术 可 以 有 效 地 改善 应 用 程序 的 性 能 。 目 前 ， 对 象 
池 技 术 已 得 到 广泛 的 应 用 ， 如 对 于 网 络 和 数据 库 连 接 这 类 重量 级 的 对 象 ， 一 般 都 会 采用 对 
象 池 技术 。 但 在 使 用 对 象 池 技术 时 也 要 注意 如 下 问题 : 
口 并非 任何 情况 下 都 适合 采用 对 象 池 技术 。 基 本 上 ， 只 在 重复 生成 某 种 对 象 的 操作 
成 为 影响 性 能 的 关键 因素 的 时 候 ， 才 适合 采用 对 象 池 技术 。 而 如 果 进 行 池 化 所 能 
带 来 的 性 能 提高 并 不 重要 的 话 ， 还 是 不 采用 对 象 池 化 技术 为 佳 ， 以 保持 代码 的 
简明 。 
口 ”要 根据 具体 情况 正确 选择 对 象 池 的 实现 方式 。 如 果 是 创建 一 个 公用 的 对 象 池 技术 
实现 包 ， 或 需要 在 程序 中 动态 指定 所 池 化 对 象 的 Class 类 型 时 ， 才 选择 通用 对 象 
池 。 而 大 部 分 情况 下 ， 采 用 专用 对 象 池 就 可 以 了 。 
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详解 Class 文件 


Java Class 文件 是 对 Java 程序 二 进 制 文 件 格式 的 精确 定义 。 每 一 个 Java 
Class 文件 都 对 一 个 Java 类 或 者 Java 接口 做 出 了 全 面 描述 。 在 一 个 Class 文件 
中 只 能 包含 一 个 类 或 者 接口 。 无 论 Jaova Class 文件 在 何 种 系统 上 产生 ， 无 论 虚 
拟 机 在 何 种 系统 上 运行 ， 对 Java Class 文件 的 精确 定义 ， 可 以 使 所 有 Java 虚拟 
机 都 能 够 正确 地 读 取 并 解释 所 有 Java Class 文件 。 本 章 将 详细 讲解 Java 中 
Class 文件 的 基本 知识 。 
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6.1 Class 介绍 


在 《The Java™ Virtual Machine Specification》( 第 二 版 ) 中 声明 : Java Class 文件 由 8 位 
字 节 流 组 成 ， 所 有 的 16 位 、32 位 和 64 位 数据 分 别 通过 读 入 2 个 、4 个 和 8 个 字 节 来 构 
造 ， 多 字 节 数据 总 是 按照 Big-endian 顺序 来 存放 ， 即 高 位 字 节 在 前 ( 放 在 低地 址 )。 每 个 
Class 文件 都 包含 且 仅 包含 一 个 Java 类 型 (类 或 者 接口 )。 

由 此 可 见 ，Java Class 文件 就 是 指 符合 特定 格式 的 字 节 流 组 成 的 二 进 制 文件 。 这 个 特 
定 的 格式 就 是 指 第 二 节 要 讨论 的 Class 文件 格式 ， 亦 即 在 《The Java™ Virtual Machine 
Specification》 中 定义 的 Class 文件 格式 。 从 另 一 个 角度 来 说 ， 这 个 特定 格式 就 是 指 JVM 
能 够 识别 、 装 载 的 格式 。 为 什么 这 么 说 呢 ? 因为 VM 在 装载 Class 文件 时 ， 要 进行 Class 
文件 验证 ， 以 保证 装载 的 Class 文件 内 容 符合 正确 的 内 部 结构 。 这 个 内 部 结构 指 的 就 是 这 
个 特定 格式 ， 只 要 是 符合 这 个 特定 格式 的 Class 文件 都 是 合法 的 、 规 范 的 Class 文件 ， 都 是 
JVM 能 够 装载 的 Class 文件 。 

在 讲 Class 文件 的 格式 之 前 ， 需 要 先 了 解 和 Class 文件 相关 的 三 个 概念 ， 具 体 如 下 。 

1) 数据 类 型 

Java Class 文件 的 数据 用 自己 定义 的 一 个 数据 类 型 集 来 表示 ， 即 ul 、u2、u4， 分 别 用 
于 表示 一 个 无 符号 类 型 的 、 占 1、2、4 个 字 节 的 数据 。 在 现实 应 用 中 ， 人 们 通常 把 这 个 数 
据 类 型 集 称 之 为 Class 文件 的 基本 类 型 ， 所 以 在 本 书 中 我 们 也 用 基本 类 型 来 表示 Java Class 
文件 的 数据 。 

2) 表 

表 (table) 由 项 ( 见 本 章 后 面 的 内 容 ) 组 成 ， 用 于 几 种 Class 文件 结构 中 。Java Class 文件 格 
式 用 一 个 类 似 于 C 结构 的 记号 编写 的 伪 结 构 来 表示 。 这 个 伪 结 构 指 的 就 是 这 里 的 表 ， 例 
如 ，ClassFile 表 就 是 这 种 伪 结 构 的 一 个 典型 例子 ， 本 书 中 所 有 的 表 都 是 指 这 种 伪 结 构 的 
表 。 表 的 大 小 是 可 变 的 ， 这 是 因为 它 的 组 成 部 分 项 是 可 变 的 。 注 意 : 这 里 的 可 变 是 针对 
Class 层次 而 言 的 ， 即 在 不 同 的 Class 文件 中 该 项 的 大 小 可 能 不 一 样 的 ， 但 是 对 于 每 一 个 具 
体 的 Class 文件 来 说 ， 这 个 项 的 大 小 又 是 一 定 的 ， 因 而 这 个 表 的 大 小 也 是 一 定 的 。 

3) 项 

描述 Java Class 文件 格式 的 结构 的 内 容 称 为 项 (Items)。 每 个 项 都 有 自己 的 类 型 和 名 
称 。 项 的 类 型 可 能 是 基本 类 型 ， 也 可 能 是 一 个 表 的 名 字 ， 这 种 项 都 是 一 些 数组 项 。 数 组 项 
的 每 一 个 元 素 都 是 一 个 表 ， 这 个 表 同 顶层 的 ClassFile 表 一 样 ， 也 都 是 一 种 伪 结 构 ， 也 都 是 
由 一 些 项 构成 的 ， 而 且 这 些 表 不 一 定 是 同一 种 格式 的 ， 因 此 ， 数 组 项 也 可 以 看 作 一 个 可 变 
大 小 的 结构 流 J。 这 些 表 对 于 该 数组 项 来 说 就 是 子 项 ， 当 然 子 项 可 能 还 有 子 项 (目前 子 项 的 
深度 最 多 就 两 层 )。 项 的 名 称 就 是 《JVM Spec》(Java 虚拟 机 规范 ) 中 指定 的 一 些 名 称 。 另 
外 ， 项 也 是 有 大 小 的 ， 对 于 没有 子 项 的 项 来 说 ， 其 大 小 是 固定 的 ， 对 于 有 子 项 的 项 来 说 ， 
其 大 小 是 可 变 的 。 在 一 个 具体 的 Class 文件 中 ， 一 个 可 变 项 (数组 ) 的 大 小 都 会 在 其 前 一 项 中 
指定 ， 为 什么 会 是 这 样 的 呢 ? 因为 在 Class 文件 中 ， 每 个 项 按 规范 中 定义 好 的 顺序 存储 在 
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Class 文件 中 ， 相 邻 的 项 之 间 没有 任何 间隔 ， 连 续 的 项 (数组 ) 也 是 按 顺 序 存储 ， 不 进行 填充 
或 者 对 齐 ， 这 样 可 以 使 Class 文件 紧凑 。 

虽然 Class 文件 与 Java 语言 结构 相关 ， 但 它 并 不 一 定 必须 与 Java 语言 相关 。 如 图 6-1 
所 示 ， 可 以 使 用 其 他 语言 来 编写 程序 ， 然 后 将 其 编译 为 Class 文件 ， 或 者 把 Java 程序 编译 
为 另 一 种 不 同 的 二 进 制 文件 格式 。 实 际 上 ，Java Class 文件 的 形式 能 够 表示 Java 源 代 码 中 
无 法 表达 的 有 效 程序 ， 然 而 ， 绝 大 多 数 Java 开发 者 几乎 都 会 选择 使 用 Class 文件 作为 程序 


传 给 虚拟 机 的 首要 方式 。 
JaVa 
文件 
Java 
其 他 语言 程序 [六 半 编译 器 Class 
文 任 
Java 程 序 | 一 > 编译 器 =====9 Gt a 


6-1 Java 语言 与 Class 文件 之 间 排 他 性 的 关系 


如 前 所 述 ，Java Class 文件 是 8 位 字 节 的 二 进 制 流 。 数 据 项 按 顺 序 存 储 在 Class 文件 
中 ， 相 邻 的 项 之 间 没 有 任何 间隔 ， 这 样 可 以 使 Class 文件 紧凑 。 占 据 多 个 字 节 空间 的 项 按 
照 高 位 在 前 的 顺序 分 为 几 个 连续 的 字 节 存放 。 

和 Java 的 类 可 以 包含 多 个 不 同 的 字段 ， 跟 方法 、 方 法 参数 和 局 部 变量 等 一 样 ，Java 
Class 文件 也 能 够 包含 许多 不 同 大 小 的 项 。 在 Class 文件 中 ， 可 变 长 度 项 的 大 小 和 长 度 位 于 
其 实际 数据 之 前 。 这 个 特性 使 得 Class 文件 流 可 以 从 头 到 尾 被 顺序 解析 ， 首 先 读 出 项 的 大 
小 ， 然 后 读 出 项 的 数据 。 


6.2 ”Java Class 文件 的 格式 


在 接 下 来 的 内 容 中 ， 开 始 正式 解析 Class 文件 的 格式 。 要 想 分 析 Class 文件 的 格式 ， 需 
要 先 解 析 表 ClassFile 的 结构 ， 因 为 这 是 Class 文件 最 外 层 的 结构 ， 也 就 是 Class 文件 的 
格式 。 

ClassFile 表 的 结构 如 下 : 


ClassFile { 
u4 magic; 
u2 minor version; 
U2 major version; 
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u2 constant pool count; 
cp info constant pool[constant pool count-1]7 
u2 access flags; 
u2 this Class; 
u2 super Class; 
u2 interfaces count; 
u2 interfaces[interfaces count]; 
u2 fields count; 
field info fields[fields count]; 
u2 methods count; 
method info methods [methods count]; 
u2 attributes count; 
attribute info attributes[attributes count]; 
} 
ClassFile 表 结 构 由 16 个 不 同 的 项 组 成 ， 下 面 列 出 了 主要 项 的 具体 说 明 。 
1) magic 
每 个 class 文件 的 前 4 个 字 节 被 称 为 它 的 魔 数 (magic number):0xCAFEBABE。 魔 数 的 作 
用 是 可 以 轻松 地 分 辨 出 Java Class 文件 和 非 Java Class 文件 。 如 果 一 个 文件 不 是 以 
“0xCAFEBABE” 开 头 ， 它 就 肯定 不 是 Java Class 文件 ， 因 为 它 不 符合 规范 J。 当 Java 还 
称 为 “Oak” 的 时 候 ， 这 个 魔 数 就 已 经 定 下 来 了 ， 它 预示 了 Java 这 个 名 字 的 出 现 。 
2) minor version 和 major version 
Class 文件 的 下 面 4 个 字 节 包含 了 次 、 主 版 本 号 。 通 常 只 有 给 定 主 版 本 号 和 一 系列 次 版 
本 号 后 ，Java 虚拟 机 才能 够 读 取 Class 文件 。 如 果 Class 文件 的 版 本 号 超出 了 Java 虚拟 机 
所 能 够 处 理 的 有 效 范围 ，Java 虚拟 机 将 不 会 处 理 该 Class 文件 。 例如， 对 于 J2SE5.0 版 本 
的 虚拟 机 来 说 ， 就 不 能 执行 由 J2SE6.0 版 本 的 编译 器 编译 出 来 的 Class 文件 。 
3) constant pool count 
版 本 号 后 面 的 项 是 constant_ pool _ count 即 常量 池 计 数 项 ， 该 项 的 值 必须 大 于 零 ， 它 给 
出 该 Class 文件 中 常量 池 列 表 项 的 元 素 个 数 ， 这 个 计数 项 包括 了 索引 为 0 的 constant_pool 
表 项 ， 但 是 该 表 项 不 出 现在 Class 文件 的 constant pool 列表 中 ， 因 为 它 被 保留 为 Java 虚拟 
机 内 部 实现 使 用 了 ， 因 此 常量 池 列 表 的 元 素 个 数 constant pool count-1， 各 个 常量 池 表 项 的 
索引 值 分 别 为 1 到 constant pool count-1l。 
上 面 提 到 的 常量 池 即 constant pool， 常 量 池 列表 就 是 指 constant pool[ ]， 常 量 池 表 项 
即 指 常量 池 列 表 中 的 某 一 个 具体 的 表 项 (元 素 )。 这 些 常量 池 表 项 的 可 能 类 型 如 下 : 
口 “ 入 口 类 型 CONSTANT _Class: 标志 值 是 7; 
入 口 类 型 CONSTANT Fieldref: 标志 值 是 9; 
入 口 类 型 CONSTANT_ Methodref: 标志 值 是 10; 
入 口 类 型 CONSTANT InterfaceMethodref: 标志 值 是 11; 
入 口 类 型 CONSTANT String: 标志 值 是 8; 
入 口 类 型 CONSTANT Integer: 标志 值 是 3; 
入 口 类 型 CONSTANT Float: 标志 值 是 4; 
入 口 类 型 CONSTANT Long: 标志 值 是 5; 
入 口 类 型 CONSTANT_Double: 标志 值 是 6; 
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口 ”入口 类 型 CONSTANT NameAndType: 标志 值 是 12; 

口 入 口 类 型 CONSTANT Utf8: 标志 值 是 1。 

4) constant pool[ ] 

constant pool count 项 下 面 是 constant pool[ ] 项 ， 即 常量 池 列 表 ， 在 里 面 存储 了 该 
ClassFile 结构 及 其 子 结构 中 引用 的 各 种 常量 ， 例 如 ， 文 字 字符 串 、final 变量 值 、 类 名 和 方 
法 名 等 等 。 在 Java Class 文件 中 ， 常 量 池 表 项 使 用 cp_info 结构 来 描述 ， 常 量 池 列 表 就 是 由 
constant pool _ count-] 个 连续 的 、 可 变 长 度 的 cp_info 表 结 构 构 成 的 constant_ pool[ ] 数 组 。 
每 一 个 常量 池 表 项 都 是 一 个 变 长 结构 ， 其 通常 格式 如 下 : 

cp info { 

ul tag; 


ul info[]; 
} 


cp_info 表 的 tag 项 是 一 个 无 符号 的 byte 类 型 值 ， 它 表明 了 cp_info 表 的 类 型 和 格式 。 
cp_info 其 实 只 是 一 个 抽象 的 概念 ， 在 Class 文件 中 ， 它 表现 为 一 系列 具体 的 、 形 如 
CONSTANT xxxx_info 的 constant_pool 结构 ， 其 具体 的 格式 由 cp_info 表 的 tag 项 ( 即 第 一 
个 字 节 ) 来 确定 。 不 同 的 cp_info 表 的 info[] 项 是 不 一 样 的 ， 例 如 ，CONSTANT _Class_info 
表 的 info[] 项 是 “u2 name index”， 而 CONSTANT Utf8 info 表 的 info[] 项 是 “u2 length; 
ul bytes[length]:”， 很 明显 ， 这 两 个 cp_info 表 是 不 一 样 的 ， 所 以 常量 池 表 项 的 大 小 是 可 变 
的 。 由 于 常量 池 列 表 中 的 每 个 常量 池 表 项 的 结构 是 不 一 样 ， 因 此 常量 池 列 表 的 大 小 也 是 可 
变 的 。 在 Class 文件 中 ， 常 量 池 列表 项 是 一 个 可 变 长 度 的 结构 流 。 

当 cp_info 表 中 tag( 标 志 ) 项 的 值 为 1 时 ， 当 前 的 cp_info 就 是 一 个 CONSTANT_ 
Utf8_info 表 结 构 ， 如 果 cp_info 表 中 tag 项 的 值 为 3， 当 前 的 cp_info 就 是 一 个 
CONSTANT _Integer_info 表 结构 ， 其 他 情况 类 推 。 

5) access flags 

紧 接 常量 池 后 的 两 个 字 节 称 为 access_flags，access_flags 项 描述 了 该 Java 类 型 的 一 些 
访问 标志 信息 。 例 如 ， 访 问 标 志 指 明文 件 中 定义 的 是 类 还 是 接口 ,访问 标志 还 定义 了 在 类 
或 接口 的 声明 中 ， 使 用 了 哪些 修饰 符 ， 类 和 接口 是 抽象 的 还 是 公共 的 等 等 。 实 际 上 ， 
access_flags 项 的 值 是 Java 类 型 声明 中 使 用 的 访问 标志 符 的 掩 码 (Mask)， 这 里 掩 码 指 的 是 
access_flags 的 值 是 所 有 访问 标志 值 的 总 和 ， 当 然 ， 未 被 使 用 的 标志 位 在 Class 文件 中 都 被 
设置 为 0。 例 如 ， 如 果 access flags 的 值 是 0x0001， 则 表示 该 Java 类 型 的 访问 标志 符 是 
ACC_PUBLIC; 如 果 access_flags 的 值 是 0x0011， 则 表示 该 Java 类 型 的 访问 标志 符 是 
ACC _ PUBLIC 和 ACC FINAL， 因 为 只 有 这 两 个 标志 位 的 和 才 可 能 是 0x0011; 其 他 情况 
类 推 。 

一 个 Java 类 型 的 所 有 access_flags 标志 符 如 下 : 

口 ACC PUBLIC: 值 是 0x0001， 声 明 为 public， 可 以 从 它 的 包 外 访问 。 

ACC_ FINAL: 值 是 0x0010， 声 明 为 final， 不 允许 有 子 类 。 
ACC_SUPER: 值 是 0x0020， 用 invokespecial 指令 处 理 超 类 的 调用 。 
ACC INTERFACE: 值 是 0x0200， 表 明 是 一 个 接口 ， 而 不 是 一 个 类 。 
ACC_ABSTRACT: 值 是 0x0400， 声 明 为 abstract， 不 能 被 实例 化 。 
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需要 说 明 的 是 ， 这 是 针对 一 个 Java 类 型 的 访问 标志 符 列 表 ， 有 的 标志 符 只 有 类 可 以 使 
用 ， 有 的 标志 符 只 有 接口 才 可 以 使 用 。 

6) this_class 

接 下 来 的 两 个 字 节 为 this_class 项 ， 值 为 一 个 对 常量 池 表 项 的 索引 ， 即 它 指向 一 个 常量 
池 表 项 ， 而 且 该 常量 池 表 项 必须 为 CONSTANT Class info 表 的 结构 。 该 表 有 一 个 
name index 项 ， 该 项 将 指向 另 一 个 常量 池 表 项 ， 该 表 项 包含 了 该 类 或 者 接口 的 完全 限定 
名 称 。 

7) super class 

紧 接着 this_class 之 后 的 两 个 字 节 是 super_class 项 ， 该 项 必须 是 对 常量 池 表 项 的 一 个 
有 效 索引 或 者 值 为 0。 如 果 super class 项 的 值 为 0， 则 该 Class 文件 必须 表示 
java.lang.Object 类 。 如 果 super class 项 的 值 不 为 0， 则 又 分 为 两 种 情况 ， 若 该 Class 文件 表 
示 一 个 类 ， 则 super_class 项 必须 是 对 常量 池 中 该 类 的 超 类 的 CONSTANT Class_ info 表 项 
的 索引 ， 这 个 超 类 和 它 的 任何 超 类 都 不 能 是 一 个 final 类 ; 若 该 Class 文件 表示 一 个 接口 ， 
则 super_class 项 必须 是 对 常量 池 中 表示 java.lang.Object 类 的 一 个 CONSTANT _Class_ info 
表 项 的 索引 。 

8) interfaces count 和 interfaces[ ] 

紧 接着 super_class 项 后 面 的 两 个 字 节 是 interfaces_count 项 ， 此 项 表示 由 该 类 直接 实现 
或 者 由 该 接口 所 扩展 的 超 接口 的 数量 。 紧 接着 interfaces_count 项 后 面 的 是 interfaces 列表 
项 ， 它 包含 了 由 该 类 直接 实现 或 者 由 该 接口 所 扩展 的 超 接口 的 常量 池 索 引 ， 共 计 
interfaces_count 个 索引 。interfaces 列表 中 的 常量 池 索 引 按照 该 类 型 在 源 代 码 中 给 定 的 从 左 
到 右 的 顺序 排列 。 

9) fields count 和 fields[ ] 

接 下 来 的 是 fields_count 项 ， 该 项 的 值 给 出 了 fields 列表 项 中 的 field_info 表 结 构 的 数 
量 ， 即 表示 了 该 Java 类 型 声明 的 类 变量 和 实例 变量 的 个 数 总 和 。 

fields 列表 项 包含 了 在 该 Java 类 型 中 声明 的 所 有 字段 的 完整 描述 。fields 列表 中 的 每 个 
field_info 表 项 都 完整 地 表示 了 一 个 字段 的 信息 ， 包 括 该 字段 的 名 称 、 描 述 符 和 修饰 符 等 。 
这 些 信息 有 的 放 在 field_info 表 中 ， 例 如 ， 修 饰 符 ， 有 的 则 放 在 field_info 表 所 指向 的 常量 
池 中 ， 例 如 ， 名 字 和 描述 符 。fields 列表 项 也 是 一 个 变 长 结构 。 

在 此 需要 说 明 的 是 ， 只 有 在 该 Java 类 型 中 声明 的 字段 才 可 能 在 fields 列表 中 列 出 ， 
fields 列表 中 不 包括 从 超 类 或 者 超 接口 中 继承 而 来 的 字段 信息 。 

10) methods_count 和 methods[ ] 

在 Class 文件 中 ， 紧 接着 fields 后 面 的 是 对 在 该 Java 类 型 中 所 声明 的 方法 的 描述 。 首 
先是 methods_count 项 ， 它 占 两 个 字 节 长 度 ， 它 的 值 表示 对 该 Java 类 型 中 声明 的 所 有 方法 
的 总 计数 。methods count 项 后 面 是 methods 列表 项 ， 它 由 methods count 个 连续 的 
Imethod info 表 构 成 。 每 个 method_info 表 都 包含 了 与 一 个 方法 相关 的 信息 ， 如 方法 名 、 描 
述 符 ( 即 方法 的 返回 值 及 参数 类 型 ) 以 及 一 些 其 他 信息 。 如 果 一 个 方法 既 非 abstract 也 非 
native， 那 么 该 method info 表 将 包含 该 方法 局 部 变量 所 需 的 栈 空 间 长 度 、 为 方法 所 捕获 的 
异常 表 、 字 节 码 序列 以 及 可 选 的 行 号 表 和 局 部 变量 表 等 信息 。 
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在 此 需要 说 明 的 是 ， 只 有 在 该 Java 类 型 中 显 式 定义 的 方法 才 可 能 在 fields 列表 中 列 
出 ，fields 列表 中 不 包括 从 超 类 或 者 超 接 口中 继承 而 来 的 方法 信息 。 

11) attributes_count 和 attributes[ ] 

Class 文件 中 最 后 的 部 分 是 属性 (attribute)， 它 给 出 了 在 该 Java 类 型 中 所 定义 的 属性 的 
基本 信息 。 首 先是 attributes_count 项 ， 它 占 两 个 字 节 长 度 ， 它 的 值 表示 在 后 续 的 attributes 
列表 中 的 attributes_info 表 的 总 个 数 。 每 个 attributes info 表 的 第 一 项 都 是 对 常量 池 中 
CONSTANT_Utf8_info 表 项 的 一 个 索引 ， 该 表 给 出 了 此 属性 的 名 称 。 

在 此 需要 说 明 的 是 ， 属 性 有 很 多 种 ， 在 Class 文件 中 的 很 多 地 方 都 出 现 了 属性 这 一 
项 ， 在 顶层 ClassFile 表 中 有 attributes 属性 项 ， 在 field_info 表 中 也 有 attributes 属性 项 ， 在 
method info 中 也 有 attributes 属性 项 ， 但 是 它们 各 有 各 的 功能 。 权 威 者 曾经 为 ClassFile 表 
结构 的 attributes 列表 项 定义 的 唯一 属性 是 SourceFile 属性 ， 为 field info 表 结 构 的 
attributes 列表 项 定义 的 唯一 属性 是 ConstantValue 属性 ， 为 method info 表 结 构 的 attributes 
列表 项 定义 的 属性 是 Code 属性 和 Exceptions 属性 。 

综 上 所 述 ，Class 文件 格式 是 一 个 规范 性 的 格式 。 此 规范 指 的 是 上 面 提 到 的 这 些 表 结构 
本 身 的 规范 性 ， 以 及 这 些 表 结构 之 间 包 含 关系 的 规范 性 。ClassFile 表 就 是 Class 文件 最 外 
层 的 结构 ， 也 就 是 说 ， 这 就 是 Class 文件 的 格式 。 而 ClassFile 表 又 是 一 些 项 组 成 的 ， 这 些 
项 的 内 容 都 要 符合 《JVM Spec》 中 定义 的 规范 。 具 体 来 说 ， 如 果 这 个 项 的 类 型 是 基本 类 
型 ， 该 项 的 值 要 符合 规范 ， 例 如 ，magic 项 一 定 要 是 0xXCAFEBABE，access_flags 项 的 值 一 
定 要 是 有 效 的 标志 值 等 ; 若 这 个 项 的 类 型 是 一 个 表 名 ， 即 该 项 是 一 个 数组 项 ， 那 么 该 数组 
项 列表 中 的 每 一 个 表 项 都 要 是 一 个 合法 的 、 规 范 的 表 ， 不 能 是 一 个 规范 中 没有 定义 的 新 
表 ， 这 就 是 包含 关系 的 规范 性 ， 同 样 ， 列 表 项 中 的 每 个 表 项 本 身 也 都 要 是 符合 其 规范 定义 
的 表 项 ， 例 如 常量 池 列 表 中 的 某 个 CONSTANT Class_ info 表 的 name index 项 不 是 对 一 个 
CONSTANT Utfg info 表 结 构 的 索引 ， 那 么 这 个 常量 池 的 表 项 就 不 是 一 个 合法 的 表 项 ， 因 
而 这 个 常量 池 列 表 项 就 是 不 符合 规范 的 ， 因 而 整个 文件 就 是 不 符合 规范 的 。 


6.3 ”常量 池 的 具体 结构 


在 Java 程序 中 ， 有 很 多 的 东西 是 永恒 的 ， 不 会 在 运行 过 程 中 变化 。 比 如 一 个 类 的 名 
字 ， 一 个 类 字段 的 名 字 / 所 属 类 型 ， 一 个 类 方法 的 名 字 / 返 回 类 型 /参数 名 与 所 属 类 型 ， 一 个 
常量 ， 还 有 在 程序 中 出 现 的 大 量 的 字面 值 。 比 如 下 面 代码 中 加 粗 部 分 显示 的 内 容 。 


public class ClassTest { 
private String items =" 我 们 "; 
private final int itemI =100 ; 
public void setItemS (String para ){...} 
} 
而 这 些 在 JVM 解释 执行 程序 的 时 候 是 非常 重要 的 。 那 么 编译 器 将 源 程序 编译 成 Class 
文件 后 ， 会 用 一 部 分 字 节 分 类 存储 这 些 永恒 不 变 的 红色 东西 。 而 这 些 字 节 我 们 就 称 为 常量 
池 。 事 实 上 ， 只 有 JVM 加 载 Class 后 ， 在 方法 区 中 为 它们 开辟 了 空间 才 更 像 一 个 “ 池 ”。 


PP >> 


正如 上 面 所 示 ， 一 个 程序 中 有 很 多 永恒 的 加 粗 东 西 。 每 一 个 都 是 常量 池 中 的 一 个 常量 
表 ( 常 量 项 )。 而 这 些 常量 表 之 间 又 有 不 同 ，Class 文件 共有 11 种 常量 表 ， 如 表 6-1 所 示 。 


表 6-1 Class 文件 的 常量 表 


常量 表 类 型 描 述 
CONSTANT Utf8 UTF-8 编码 的 Unicode 字符 串 
CONSTANT Integer int 类 型 的 字面 值 
CONSTANT Float float 类 型 的 字面 值 
CONSTANT Lons long 类 型 的 字面 值 
CONSTANT Double double 类 型 的 字面 值 


CONSTANT _ Class 
CONSTANT String 
CONSTANT Fieldref 
CONSTANT Methodref 
CONSTANT InterfaceMethodref 
CONSTANT NameAndType 


对 一 个 类 或 接口 的 符号 引用 
String 类 型 字面 值 的 引用 
对 一 个 字段 的 符号 引用 
对 一 个 类 中 方法 的 符号 引用 
对 一 个 接口 中 方法 的 符号 引用 
对 一 个 字段 或 方法 的 部 分 符号 引用 


下 面 将 一 个 源 程序 编译 成 Class 文件 后 ， 对 文件 中 的 每 一 个 字 节 的 分 析 ， 可 以 更 好 地 
理解 Class 文件 的 内 容 以 及 常量 池 的 组 成 。Java 代码 如 下 : 


package hr.test; 

//classTest 类 

public class ClassTest { 
private int itemI=0; //itemI 类 字段 
private static String itemS=" 我 们 "; //items 类 字段 
private final float PI=3.1415926F; //PI 类 字段 
// 构 造 器 方法 
public ClassTest (){ 


} 

//getItemI 方法 

public int getItemI (){ 
return this.itemI; 

} 

//getItems 方法 

public static String getItems(){ 
return items; 


} 
//main 主 方法 
public static void main(String[] args) { 
ClassTest ct=new ClassTest (); 
} 
} 
接 下 来 开始 分 析 TestClass.class 文件 的 字 节 码 ， 字 节 顺 序 从 上 到 下 ， 从 左 到 右 。 每 个 


字 节 用 一 个 0 一 255 的 十 进 制 整数 表示 。 


202 254 186 190  -- 魔 数 
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0 0 -- 次 版 本 号 

0 50 ”-- 主 版 本 号 

0 43 ”-- 常量 池 中 常量 表 的 数量 有 42 个 ， 下 面 红 色 括号 中 的 数据 表明 该 常量 表 所 在 常量 
池 中 的 索引 ， 从 索引 1 开始 


(1) 7 0 2 -- 对 类 classTest 的 符号 引用 (7 为 标志 02 指向 了 常量 池 的 索引 2 的 位 置 ) 


YO0 7 104 114 47 116;: 101 115"116. 47 '67 108: 97 115 115 84 101 115 
116 -- 类 全 限定 名 hr\test\ClassTest 
(3) 7 0 4 ， -=- 对 类 object 的 符号 引用 


(4) 1 0 16 106 97 118 97 47 108 97 110 103 47 79 98 106 101 99 116 -- 
超 类 全 限定 名 java/lang/Object 

(5) 1 0 5 105 116 101 109 73  -- 第 1 个 类 字段 名 itemI 

(6) 10173  -- I 第 1 个 类 字段 类 型 为 整 型 

(7) 1 0 5 105 116 101 109 83  -- 第 2 个 类 字段 名 items 

(8) 1 0 18 76 106 97 118 97 47 108 97 110 103 47 83 116 114 105 110 103 
59 ”-- 第 2 个 类 字段 类 型 的 全 限定 名 Ljava/lang/string 

(9) 1 0 2 80 73 -- 第 3 个 类 字段 名 PI 

(10) 1 0 1 70 -- 第 3 个 类 字段 类 型 为 float 

(Er ole tt i ee a ts ETIOT 第 富 
类 字段 为 常量 constantValue 


(12) 4 64 73 15 218  -- 第 3 个 类 字段 float 字面 值 , 占 4bytes (3.1415926) 
(13) 10 8 60 99 108 105 110 105 116 62  -- <clinit> 初始 化 方法 名 
(14) 10 3 40 41 86 -- ()V 方法 的 返回 类 型 为 void 


(15) 
(16) 


Oa 67 I OO TO -- Code 
0 17 -- String 字符 串 字 面值 (0 17 表示 索引 1 7) 

(17) 1 0 6 230 136 145 228 187 172 ”-- "我 们 " 

(18) 901019 -- 指 向 第 2 个 字段 的 引用 (0 1 指向 索引 1，0 19 指向 索引 19) 
(19) 12 0 7 0 8 -=-- 指 向 第 2 个 字段 的 名 字 和 描述 符 的 索引 

(20) 1 0 15 76 105 110 101 78 117 109 98 101 114 84 97 98 108 101  -- 


Fo 上 


LineNumberTable 

(21) 0 18 76 111 99 97 108 86 97 114 105 97 98 108 101 84 97 98 108 101 
-- LocalVariableTable 

(22) 1 0 6 60 105 110 105 116 62 -- <init> 表示 初始 化 方法 名 


(23) 10 0 3 0 24 -- 指向 父 类 object 的 构造 器 方法 ，0 3 表示 父 类 名 常量 表 的 索引 ，0 
24 表示 存放 该 方法 名 称 和 描述 符 的 引用 的 常量 表 的 索引 

(24) 12 0 22 0 14 -- 指向 方法 名 和 描述 符 的 常量 表 的 索引 。0 22 是 方法 名 的 常量 表 索 
引 ，0 14 是 描述 符 的 常量 表 索 引 


(25) 9 0 1 0 26 ”-- 指向 第 1 个 字段 的 引用 ，0 1 表示 字段 所 属 类 型 的 索引 ，0 26 表示 字 
段 名 和 描述 符 的 索引 

(26) 12 0 5 0 6 -=-- 指 向 第 1 个 字段 的 名 字 和 描述 符 的 索引 

(27) 9 0 1 0 28 -=-- 指向 第 3 个 字段 的 引用 ，0 1 表示 字段 所 属 类 型 的 索引 ，0 28 表示 字 
段 名 和 描述 符 的 索引 

(28) 12 0 9 0 10 -- 指向 第 3 个 字段 的 名 字 和 描述 符 的 索引 

(29) 1 0 4 116 104 105 115 ”-- 隐 含 参数 符号 this 

(30) 1 0 11 76 67 108 97 115 115 84 101 115 116 59  -- LClassTest; 

(3 110 8 103 101 116 73 7116 101 109 73 方法 名 5SETEemr 

(32) 10 3 40 41 73  -- (0I 方法 描述 符 :返回 类 型 int 

(33) 1 0 8 103 101 116 73 116 101 109 83 -- 方法 名 getItems 

(34) 1 0 20 40 41 76 106 97 118 97 47 108 97 110 103 47 83 116 114 105 
110 103 59 --- 方法 描述 符 ()Ljava/lang/string; 


dN p> 


evant 
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ED) -- 主 方法 名 main 

(36) 1 0 22 40 91 76 106 97 118 97 47 108 97 110 103 47 83 116 114 105 

110 103 59 41 86 ” ---()Ljava/lang/String;)V 主 方法 中 的 参数 的 字符 串 数组 类 型 名 

(37) 10 0 1 0 24 ”指向 当前 classTest 类 的 构造 器 方法 ，0 1 表示 存放 当前 类 名 的 常量 

表 的 索引 。0 24 是 存放 方法 名 和 描述 符 的 符号 引用 的 常量 表 索 引 。 

(38) 1 0 4 97 114 103 115 -- 参数 args 

(39) 1 0 19 91 76 106 97 118 97 47 108 97 110 103 47 83 116 114 105 110 

103 59  -- 字符 串 数组 [Ljava/lang/string; 

(40) 1 0 2 99 116 ”--- 对 象 符号 ct 

(41) 1 0 10 83 111 117 114 99 101 70 105 108 101  -- SourceFile 

(42) 1 0 14 67 108 97 115 115 84 101 115 116 46 106 97 118 97 -- ClassTest.java 

上 述 部 分 表示 常量 池 字 节 码 区 域 ， 具 体 说 明 如 下 。 

口 ”所 有 的 字面 值 都 是 存放 在 常量 池 中 的 。 特 别 注意 的 是 “我 们 ”这 个 字符 串 常 量 也 
是 在 常量 池 中 的 。 如 果 一 个 程序 出 现 多 个 “我 们 ”， 那 么 常量 池 中 也 只 会 有 一 
个 。 另 外 ， 也 正 是 因为 “我 们 ”存放 在 常量 池 中 ， 使 得 一 些 字 符 串 的 “一 ”比较 
变 得 需要 琢磨 了 一 一 这 其 实 是 在 解析 常量 池 中 的 CONSTANT String 类 型 时 ， 采 
用 了 拘留 字符 串 ， 并 将 其 地 址 放 入 了 CONSTANT String info 入 口 数 据 中 ， 以 保 
证 整个 应 用 程序 应 用 的 字面 值 相 同 字符 串 的 唯一 。 

口 “ClassTest 并 没有 任何 显示 的 父 类 。 但 在 常量 池 中 ， 我 们 发 现 有 Object 的 符号 常量 
存在 。 这 说 明 在 Java 中 任何 类 都 直接 或 间接 继承 了 Object 的 ， 而 Object 并 不 需 
要 在 代码 中 显示 继承 ，JVM 会 帮 我 们 做 到 这 一 点 。 

口 常量 池 中 有 一 个 隐 含 参数 this 的 符号 常量 (索引 29)。 即 使 程序 中 不 存在 this， 
JVM 也 会 悄悄 地 设置 一 个 这 样 的 对 象 。 


继续 分 析 此 文件 的 字 节 码 : 
0 33 ---- access flag 访问 标志 public 
0 1 =---- this class 指向 当前 类 的 符号 引用 在 常量 池 中 的 索引 
0 3 -===°S0per ciass 
0 0 ---- inteface count 接口 的 数量 
0 3 --- field count 字段 的 数量 
// 字段 itemI 
0 2 ---- private 修饰 符 
0 5 -=--- 字段 名 在 常量 池 中 的 索引 ， 字 段 itemI 
0 6 -=---- 字段 的 描述 符 (所 属 类 型 ) 在 常量 池 中 的 索引 
0 0 ”--- 字段 的 属性 信息 表 (attribute info) 的 数量 
// 字段 items 
0 10  ---- private static 修饰 符 
0 7 -=-- 字 段 名 在 常量 池 中 的 索引 ， 字 段 items 
0 8 -=-- 字 段 的 描述 符 (所 属 类 型 ) 在 常量 池 中 的 索引 
0 0 --- 字段 的 属性 信息 表 (attribute info) 的 数量 
WT BRE 
0 18  -- private final 修饰 符 


0 9 --- 字 段 名 在 常量 池 中 的 索引 ，// 字 段 PI 

0 10 --- 字 段 的 描述 符 (所 属 类 型 ) 在 常量 池 中 的 索引 

0 1 --- 字段 的 属性 信息 表 (attribute info) 的 数量 

0 11 ” --- 属性 名 在 常量 池 中 的 索引 。 即 Constantvalue 
0 0 0 2 --- 属性 所 占 的 字 节 长 度 


CE 
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0 12 ， --- 属性 值 在 常量 池 中 的 索引 。 即 常量 字面 值 


0 5 -- Method count 方法 的 数量 

// 类 的 静态 数据 初始 化 方法 <clinit> 

0 8 ---- static 修饰 符 ( 所 有 的 初始 化 方法 都 是 static 的 ) 

0 13 --- 在 常量 池 中 的 索引 。 初 始 化 方法 名 <clinit>， 该 方法 直接 由 JVM 在 特定 的 时 
候 调 用 ， 并 非 由 字 节 码 生 成 。 

0 14 --- 在 常量 池 中 的 索引 。 返 回 类 型 为 void。 


1 --- 属性 数量 

15 -- 属性 名 在 常量 池 中 的 索引 。 即 code 

0 0 42 --- 属性 所 占 的 字 节 长 度 2 

Ee oe a ee oo 

2 0 21 0 0 0 2 0 0 --- 该 方法 的 字 节 码 指令 序列 和 其 他 信息 

/类 的 普通 实例 数据 的 初始 化 方法 ， 针 对 类 构造 器 生成 的 <init> 方 法 。 

1 --- public 修饰 符 

22 --- 初始 化 方法 名 <init> 

14 --- 构造 器 的 返回 类 型 为 void 

1 -=--- 属性 数量 

15 --- 属性 名 在 常量 池 中 的 索引 。 即 code 

0 0 70 -- 属性 所 占 的 字 节 长 度 70 

2 OM OLOnone a2003 0 2304203 80 2 eae 2 2 

DVOR250%200 NONO Le on Ao 0 enonalon aro on onono so oo 2100 000 1200 

10 0 0 16 0 29 0 30 0 0 --- 该 方法 的 字 节 码 指 令 序列 和 其 他 信息 
//getItemI 方法 

1 --- public 修饰 符 

31 --- 在 常量 池 中 的 索引 。 方 法 名 getItemI 

32 --- 在 常量 池 中 的 索引 。 方 法 返回 类 型 为 int 

1 -- 属性 数量 

15 --- 属性 名 在 常量 池 中 的 索引 。 即 Code 

0 0 47 --- 属性 所 占 的 字 节 长 度 70 

oT ON ORO eS 42080 0 25 7 2000000 200200 0N0NoNe Onononon> 

021000120100050290 3000 --- 该 方法 的 字 节 码 指令 序列 和 其 他 信息 
//getItems 方法 
0 9 --- public static 修饰 符 
0 33 --- 在 常量 池 中 的 索引 。 方 法 名 getItemS 
0 34 - -- 在 常量 池 中 的 索引 。 方 法 返回 类 型 为 String 
0 1 --- 属性 数量 
0 
0 
0 


Oe ey 


[一 和 太一 克 ~ 和 一 轩 一 


15 -- 属性 名 在 常量 池 中 的 索引 。 即 code 
0 0 36 --- 属性 所 占 的 字 节 长 度 36 
on 0 0 OFmo a 7e oe re ono oo 20000000 6 0 7100 OO Ton 
21 0 0 0 2 0 0 -- 该 方法 的 字 节 码 指令 序列 和 其 他 信息 
//main 方法 
0 9 --- public static 修饰 符 
0 35 --- 在 常量 池 中 的 索引 。 主 方法 名 main 
0 36 -- 在 常量 池 中 的 索引 。 方 法 返回 类 型 为 String[] 
0 1 --- 属性 数量 
0 15 --- 属性 名 在 常量 池 中 的 索引 。 即 code 
0 0 0 65 --- 属性 所 占 的 字 节 长 度 36 
O20 2 ON OVO Oma 0 N09 L830 3 1 ONO 0 20N 0 ONO Too 
2 O00 OF2000 60 21700 24100 0022200 2 OTN OO San0 3 0 0 OO OA 
oom om 


在 上 述 文件 中 ， 字 段 PI 是 浮 点 型 常量 ， 在 编译 期 的 字 节 码 中 就 已 经 指定 好 了 PI 的 字 


PT p> 


oda 


= 一 


面值 存储 在 常量 池 中 的 某 个 索引 内 。 这 一 点 也 证 实 了 Java 中 的 常量 在 编译 期 就 已 经 得 到 了 
值 ， 在 运行 过 程 中 是 无 法 改变 的 。 
继续 分 析 此 文件 的 字 节 码 。 


0 5 -- Method count 方法 的 数量 
// 类 的 静态 数据 初始 化 方法 <clinit> 
8 ---- static 修饰 符 ( 所 有 的 初始 化 方法 都 是 static 的 ) 
13 --- 在 常量 池 中 的 索引 。 初 始 化 方法 名 <clinit>， 该 方法 直接 由 JVM 在 特定 的 时 
候 调 用 ， “并非 由 字 节 码 生成 。 
0 14 --- 在 常量 池 中 的 索引 。 返 回 类 型 为 void。 


1 --- 属性 数量 
15 -- 属性 名 在 常量 池 中 的 索引 。 即 code 
0 0 42 --- 属性 所 占 的 字 节 长 度 2 
TOT ON ORD Ole Td To roo Lomo os20n ooo ooo Oro. 
2 0 21 0 0 0 2 0 0 --- 该 方法 的 字 节 码 指令 序列 和 其 他 信息 
/类 的 普通 实例 数据 的 初始 化 方法 ， 针 对 类 构造 器 生成 的 <init> 方 法 。 
1 --- public 修饰 符 
22 --- 初始 化 方法 名 <init> 
14 --- 构造 器 的 返回 类 型 为 void 
1 -=--- 属性 数量 
15 --- 属性 名 在 常量 池 中 的 索引 。 即 code 
0 0 70 -- 属性 所 占 的 字 节 长 度 70 
200 100 000001 42 183 0 23 42030180 0 25 .42 1 T2018 oD 27 1 0 
ONON 2 00 200 0 OMe oa oo onedomalon Amo no omen oo on oo on 2 
10 0 0 16 0 29 0 30 0 0 --- 该 方法 的 字 节 码 指 令 序列 和 其 他 信息 
//getItemI 方法 


OO OO Vm 0 Ov 


0 1 --- public 修饰 符 

0 31 --- 在 常量 池 中 的 索引 。 方 法 名 getItemI 

0 32 --- 在 常量 池 中 的 索引 。 方 法 返回 类 型 为 int 

0 1 -- 属性 数量 

0 15 --- 属性 名 在 常量 池 中 的 索引 。 即 Code 

0 0 0 47 --- 属性 所 占 的 字 节 长 度 70 

Amo Onoro Dd2010N0 2o m72NON0N0 2 0020 ONOnONe OP oMonom 
021000120100050290 3000 --- 该 方法 的 字 节 码 指令 序列 和 其 他 信息 

//getItems 方法 

0 9 --- public static 修饰 符 

0 33 --- 在 常量 池 中 的 索引 。 方 法 名 getItemS 

0 34 - -- 在 常量 池 中 的 索引 。 方 法 返回 类 型 为 string 

0 1 --- 属性 数量 

0 15 -- 属性 名 在 常量 池 中 的 索引 。 即 Code 

0 0 0 36 --- 属性 所 占 的 字 节 长 度 36 

OO ON OMRON a emo on no 200 on 0 eon o oon 
21 0 0 0 2 0 0 一 -该 方法 的 字 节 码 指令 序列 和 其 他 信息 

//main 方法 

0 9 --- public static 修饰 符 

0 35 --- 在 常量 池 中 的 索引 。 主 方法 名 main 

0 36 -- 在 常量 池 中 的 索引 。 方 法 返回 类 型 为 string[] 

0 1 --- 属性 数量 

0 15 --- 属性 名 在 常量 池 中 的 索引 。 即 Code 

0 0 0 65 --- 属性 所 占 的 字 节 长 度 36 

O20 2 0 O09 187 0 89 18300 37 16 177 000 0 200 20°00 O00 ON 
A OU 
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在 上 述 代码 中 ， 主 方法 main 是 作为 ClassTest 的 类 方法 存在 的 ， 在 字 节 码 中 main 和 其 
他 的 类 方法 并 没有 什么 区 别 。 实际 上 ， 我 们 也 确实 可 以 通过 ClassTest.main(..) 来 调用 
ClassTest 中 的 main 方法 。 在 class 文件 常量 池 字 节 码 中 有 两 个 比较 特别 的 方法 名 符号 : 
<clinit> 和 <init>。 其 中 <clinit> 方 法 是 编译 器 自己 生成 的 ， 编 译 器 会 把 类 静态 变量 直接 初始 
化 语句 和 静态 初始 化 语句 块 的 代码 都 放 到 了 class 文件 的 <clinit> 方 法 中 。 而 对 所 有 非 静 态 
非常 量 数据 域 的 初始 化 工作 要 靠 <init> 方 法 来 完成 。 针 对 每 一 个 类 的 构造 方法 ， 编 译 器 都 
会 产生 一 个 <init> 方 法 。 即 使 是 缺 省 构造 器 也 不 例外 。 

为 了 说 明 class 文件 的 结构 ， 再 看 下 面 的 Java 代码 : 


public interface MyInterface { 
void hello(); 


编译 上 述 Java 代码 后 的 字 节 码 如 图 6-2 所 示 。 


由 版 本 号 常量 油 数 。。 第 量 地 素 引 1 索引 2 索引 3 索引 s 
kA BA _ BEIQ0 66 60 33160 69j[97 69 07|[07 60 68|] 4-605-68) 7..... Das h 
65—6 lello...()V...SourceF 
案 引 4 一 ...MyInterface.ja 
索引 6 1 ...MyInterface...j 


6 6 6C 61 6E 6 4F 62 6A 65 6 4 lava/lang/0bject..... 
e EE 01 94 91 99 93 99 94 69 66 99 | PO 
89 699\92 69 096 \ 辣 标 志 。。 NN 

实现 的 接口 数 “字段 数 。 方法 数 i 当前 类 索引 号 
图 6-2 编译 后 的 字 节 码 


在 上 述 图 6-2 中 ， 常 量 池 数 “0009” 表 示 后 面 紧 接着 有 8 个 常量 池 项 ， 下 面 是 8 个 常 
量 池 项 的 具体 说 明 : 

口 ” 常 量 池 索 引 1 表示 一 个 CONSTANT Class_info 表 (07)， 它 引用 索引 为 7 的 常量 池 ; 

口 常量 池 索 引 2 表示 一 个 CONSTANT _ Class info 表 (07)， 它 引用 索引 为 8 的 常 
量 池 ; 

口 ”常量 池 索 引 3 表示 一 个 CONSTANT _Utf8_info 表 (01)， 其 内 容 为 hello( 方 法 名 ); 

口 ”常量 池 索 引 4 表示 一 个 CONSTANT _Utf8_info 表 (01)， 其 内 容 为 OV( 方 法 参数 与 
返回 值 ); 

口 ”常量 池 索 引 5 表示 一 个 CONSTANT Utfg info 表 (01)， 其 内 容 为 SourceFile( 某 属 
性 值 ); 

口 常量 池 索 引 6 表示 一 个 CONSTANT Utf8 info 表 (01) ， 其 内 容 为 
MyIterface.java( 某 属性 值 ); 

口 ”常量 池 索 引 7 表示 一 个 CONSTANT Utf8_info 表 (01)， 其 内 容 为 MyInterface， 被 
常量 池 索 引 1 引用 到 (当前 类 ); 

口 常量 池 索 引 8 表示 一 个 CONSTANT Utf8 info 表 (01)， 其 内 容 为 java/lang/ 
Object， 被 常量 池 索 引 2 引用 到 ( 超 类 ); 

口 访问 标志 “0601” 表 示 是 public(0001)、abstract(0400)， 且 是 接口 (0200); 


he 


当前 类 索引 号 “0001” 表 示 指 向 常量 池 索 引 1， 指 明 当前 类 为 MyInterface; 
超 类 索引 号 “0002” 表 示 指 向 常量 池 索 引 2， 指 明 超 类 为 “java/lang/Object”; 
实现 的 接口 数 “0000” 表 示 没 有 实现 任何 接口 ; 

字段 数 “0000” 表 示 该 接口 没有 字段 ; 

方法 数 “0001” 表 示 接 口 有 一 个 方法 。 

剩 下 的 字 节 码 是 方法 列表 及 属性 列表 。 


6.4 “特殊 字 符 串 


BOG0DDn 


常量 池 中 容纳 的 符号 引用 包括 三 种 特殊 的 字符 串 : 全 限定 名 、 简 单 名称 和 描述 符 。 所 
有 的 符号 引用 都 包括 类 或 者 接口 的 全 限定 名 。 字 段 的 符号 引用 除了 全 限定 类 型 名 之 外 ， 还 
包括 简单 字段 名 和 字段 描述 符 。 方 法 的 符号 引用 除了 全 限定 类 型 名 之 外 ， 还 包括 简单 方法 
名 和 方法 描述 符 。 

在 符号 引用 中 使 用 的 特殊 字符 串 也 同样 用 来 描述 被 Class 文件 定义 的 类 或 者 接口 。 例 
如 ， 定 义 过 的 类 或 者 接口 会 有 一 个 全 限定 名 。 对 于 每 一 个 在 类 或 者 接口 中 声明 的 字段 ， 常 
量 池 中 都 会 有 一 个 简单 名 称 和 字段 描述 符 。 对 于 每 一 个 在 类 或 者 接口 中 声明 的 方法 ， 常 量 
池 中 都 会 有 一 个 简单 名 称 和 方法 描述 符 。 


6.4.1 全 限定 名 


当 常 量 池 入 口 指 向 类 或 者 接口 时 ， 它 们 给 出 该 类 或 者 接口 的 全 限定 名 。 在 Class 文件 

中 ， 全 限定 名 中 的 点 用 斜 线 取代 了 。 例 如 ， 在 Class 文件 中 ，java.lang.Object 的 全 限定 名 

表示 为 java/lang/Object; 在 Class 文件 中 ，java.util.Hashtable 的 全 限定 名 表示 为 
“java/uti/Hashtable ”。 


6.4.2 简单 名 称 


字段 名 和 方法 名 以 简单 名 称 ( 非 全 限定 名 ) 形 式 出 现在 常量 池 入 口中 。 例 如 ， 一 个 指向 
类 java.lang.Object 所 属 方法 StringtoString0 的 常量 池 入 口 有 一 个 形 如 “toStimng” 的 方法 
名 。 一 个 指向 类 java.lang.System 所 属 字 段 java.io.PrintStream.out 的 常量 池 入 口 有 个 形 如 
“out” 的 字段 名 。 


6.4.3 ”描述 符 


除了 类 (或 接口 ) 的 全 限定 名 和 简单 字段 (或 方法 ) 名 ， 指 向 字段 和 方法 的 符号 引用 还 包括 
描述 符 字符 串 。 字 段 的 描述 符 给 出 了 字段 的 类 型 ， 方 法 描述 符 给 出 了 方法 的 返回 值 和 方法 
参数 的 数量 、 类 型 以 及 顺序 。 

字段 和 方法 的 描述 符 由 如 下 所 示 的 上 下 文 无 关 语 法 定义 。 该 语法 中 非 终结 符号 用 斜体 
字 标 出 ， 如 FieldType; 终结 符号 使 用 等 宽度 字体 标 出 ， 如 B 或 V; 星 号 代表 紧 接 在 它 前 
面 的 符号 (中 间 没 有 空格 ) 将 会 出 现 0 次 或 者 多 次 。 
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表 6-2 中 列 出 了 每 个 基本 类 型 终结 符 的 含义 。V 终结 符 表示 方法 返回 值 为 void 类 型 。 
8 种 基本 类 型 终结 符 中 的 每 一 个 、 返 回 值 描述 符 终结 符 V、 对 象 类 型 终结 符 L 和 ; 数组 类 
型 终结 符 I， 以 及 方法 描述 符 汇总 终结 符 ( 和 )， 都 是 ASCII 字符 (除了 空 字符 null 外 ， 能 够 
对 应 于 ASCII 字符 的 每 一 个 Unicode 字符 在 UTF-8 格式 中 ， 都 可 以 使 用 相对 应 的 ASCII 字 
符 值 来 描述 )。 对 象 类 型 中 的 Class-name 部 分 为 全 限定 名 。 这 里 的 全 限定 名 与 Class 文件 中 
的 全 限定 名 一 样 ， 都 用 斜 线 取代 了 点 。 


表 6-2 基本 类 型 终结 符 


EE 


类 型 


Mi 
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ln-n|l-n-Imnlslow| 暑 


byte 
char 
double 
float 


int 
long 


short 


N 


boolean 


表 6-3 列 出 了 一 些 字段 描述 符 的 例子 。 在 此 需要 注意 的 是 : 实例 方法 的 方法 描述 符 并 
没有 包含 作为 第 一 个 参数 被 传 给 所 有 实例 方法 的 隐藏 this 参数 。 但 所 有 调用 实例 方法 的 
Java 虚拟 机 指令 都 会 隐 式 传递 this 参数 。this 引用 永远 不 会 传 给 方法 ， 因 为 类 方法 不 会 被 
对 象 调用 。 


表 6-3 ”字段 描述 符 举例 


java.lang.Object[] obj: 
String method(byte[] binti intj) 
boolean methodt 


(BIDLiavallang/String: 
ZILijava/lang/String:IOZ 


lean b, int i, String s, int j, int k 


常量 池 是 一 个 可 变 长 度 cp_info 表 的 有 序 序列 。cp_info 表 中 的 tag( 标 志 ) 项 是 一 个 无 符 
号 的 byte 类 型 值 ， 它 表明 了 表 的 类 型 和 格式 cp_info 表 一 共有 11 种 类 型 。 


6.5.1 OCNSTANT_Utf8_info 表 
可 变 长 度 的 CONSTANT _Utf8_info 表 使 用 一 种 UTF-8 格式 的 变 体 来 存储 一 个 常量 字 


PP TO OR p> 


Bf adnbik 


= 和 震 = 权衡 优化 、 高 效 和 安全 的 最 优 方案 对 多 


符 串 。 这 种 类 型 的 表 可 以 存储 多 种 字符 串 ， 包 括 以 下 几 项 。 

(1) 文字 字符 串 ， 如 String 对 象 。 

(2) 被 定义 的 类 和 接口 的 全 限定 名 。 

(3) 被 定义 的 类 的 超 类 (如 果 有 的 话 ) 的 全 限定 名 。 

(4) 被 定义 的 类 和 接口 的 父 接口 的 全 限定 名 。 

(5) 由 类 或 者 接口 声明 的 任意 字段 的 简单 名 称 和 描述 符 。 

(6) 由 类 或 者 接口 声明 的 任意 方法 的 简单 名 称 和 描述 符 。 

(7) 任何 引用 的 类 和 接口 的 全 限定 名 。 

(8) 任何 引用 的 字段 的 简单 名 称 和 描述 符 。 

(9) 任何 引用 的 方法 的 简单 名 称 和 描述 符 。 

(10) 与 属性 相关 的 字符 串 。 

在 CONSTANT Utfg info 表 中 存储 了 四 种 基本 信息 类 型 : 文字 字符 串 ， 被 定义 的 类 和 
接口 描述 ， 对 其 他 类 或 接口 的 符号 引用 以 及 与 属性 相关 的 字符 串 。 一 些 与 属性 相关 的 字符 
串 如 : 属性 名 称 、 产 生 class 文件 的 源 文件 名 称 、 局 部 变量 的 名 称 以 及 描述 符 。 

UTF-8 编码 格式 允许 字符 串 中 的 所 有 Unicode 字符 以 两 个 字 节 的 形式 表示 ， 而 ASCII 
字符 ( 空 字符 null 除外 ) 以 一 个 字 节 的 形式 表示 。 表 6-4 列 出 了 CONSTANT _Utf8_info 的 
格式 。 


表 6-4 CONSTANT_Utf8_info 表 的 格式 


CONSTANT _Utf8_info 表 中 各 项 的 具体 说 明 如 下 。 

口 tag: tag 项 的 值 为 CONSTANT _Utf8(1)。 

口 ”length: length 项 给 出 了 后 续 bytes 项 的 长 度 ( 字 节 数 )。 

口 ”bytes: bytes 项 中 包含 按照 变 体 UTF-8 格式 存储 的 字符 串 中 的 字符 。 从 Nu0001' 到 

wu007f 的 所 有 字符 ( 除 空 字符 null 外 所 有 的 ASCII 字符 ) 都 使 用 一 个 字 节 表示 。 

空 字 符 null(vu0000) 和 从 "ua0080' 到 "ua07 人 外 的 所 有 字符 使 用 两 个 字 节 表 示 从 \u0800' 到 
wuffff 的 所 有 字符 使 用 三 个 字 节 表示 。 

在 OCNSTANT Utfg info 表 内 ，bytes 项 中 的 UTF-8 字符 串 编 码 与 标准 UTF-8 格式 的 
区 别 在 于 : 第 一 ， 在 标准 UTF-8 编码 模式 中 ， 空 字符 null 使 用 一 个 字 节 表示 ; 在 
CONSTANT _Utf8_info 表 中 ， 空 字符 使 用 两 个 字 节 表示 。 这 种 对 于 空 字符 null 的 双 字 节 编 
码 ， 意 味 着 bytes 项 的 值 永远 不 会 为 0， 第 二 ，bytes 项 中 只 使 用 了 标准 UTF-8 编码 中 的 单 
字 节 、 双 字 节 和 三 字 节 编码 ， 而 标准 UTF_8 编码 还 包括 未 在 CONSTANT_Utf8_info 表 中 
使 用 的 较 长 的 格式 。 
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6.5.2 ”CONSTANT Integer_info 表 


固定 长 度 的 CONSTANT Integer info 表 用 来 存储 常量 int 类 型 值 ， 该 表 只 存储 int 值 ， 
不 存储 符号 引用 ， 表 6-5 列 出 了 CONSTANT Integer info 表 的 格式 。 


表 6-5 CONSTANT _Integer_info 表 的 格式 


CONSTANT Integer info 表 中 各 项 的 具体 说 明 如 下 : 
口 tag: tag 项 的 值 为 CONSTANT Integer(3); 
口 “bytes: bytes 项 中 按照 高 位 在 前 的 格式 存储 int 类 型 值 。 


6.5.3 CONSTANT_Float_info 表 


固定 长 度 的 CONSTANT Float info 表 用 来 存储 常量 float 类 型 值 ， 该 表 只 存储 float 类 
型 值 ， 不 存储 符号 引用 ， 表 6-6 中 列 出 了 CONSTANT Float info 表 的 格式 。 


表 6-6 CONSTANT_Float_info 表 的 格式 


CONSTANT Float info 表 中 各 项 的 具体 说 明 如 下 ; 

口 tag: tag 项 的 值 为 CONSTANT Float(4); 

口 ”bytes: bytes 项 中 按照 高 位 在 前 的 格式 存储 float 类 型 值 。 
6.5.4 CONSTANT_Long info 表 


固定 长 度 的 CONSTANT Long info 表 用 于 存储 long 类 型 常量 。 该 表 中 只 存储 long 类 
型 值 ， 不 存储 符号 引用 。 表 6-7 列 出 了 CONSTANG Long info 表 的 格式 。 


表 6-7 CONSTANT_Long_info 表 的 格式 


一 个 long 类 型 值 在 常量 池 中 占据 常量 池 中 的 两 个 位 置 。 在 class 文件 中 ， 一 个 long 类 
型 入 口 紧 接着 下 一 个 入 口 ， 但 下 一 个 入 口 的 索引 值 却 比 紧 挨 着 的 上 一 个 入 口 的 值 多 2。 
CONSTANT Long info 表 中 各 项 的 具体 说 明 如 下 : 
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口 tag: Ttag 项 的 值 为 CONSTANT Long(5); 
口 ”bytes: bytes 项 中 按照 高 位 在 前 的 格式 存储 long 类 型 值 。 


6.5.5 CONSTANT_Double_info 表 


固定 长 度 的 CONSTANT _ Double info 表 用 来 存储 double 类 型 常量 。 该 表 只 用 来 存储 
double 值 ， 不 存储 符号 引用 。 表 6-8 列 出 了 CONSTANT _ Double info 表 的 格式 。 


表 6-8 CONSTANT_Double_info 表 的 格式 


一 个 double 类 型 值 在 常量 池 中 占据 常量 池 中 的 两 个 位 置 。 在 class 文件 中 ，double 入 
的 下 一 个 入 口 紧 随 其 后 ， 但 下 一 入 口 的 索引 值 却 要 比 上 一 个 入 口 的 索引 值 大 2。 

CONSTANT _ Double info 表 中 各 项 的 具体 说 明 如 下 : 

口 tag: tag 项 的 值 为 CONSTANT Double(6); 

口 bytes: bytes 项 中 按照 高 位 在 前 的 格式 存储 double 类 型 值 。 


6.5.6 CONSTANT_Class_info 表 


固定 长 度 的 CONSTANT_Class_info 表 使 用 符号 引用 来 描述 类 或 者 接口 。 无 论 指向 
类 、 接 口 、 字 段 还 是 方法 ， 所 有 的 符号 引用 都 包含 一 个 CONSTANT_Class_info 表 。 表 6-9 
列 出 了 CONSTANT _Class info 表 的 格式 。 


表 6-9 CONSTANT_Class_info 表 的 格式 


Name index 


CONSTANT _ Class_info 表 中 各 项 的 具体 说 明 如 下 : 

口 tag: tag 项 的 值 为 CONSTANT _Class(7); 

口 name index: name index 项 给 出 了 包含 类 或 者 接口 全 限定 名 CONSTANT 

Utf8_info 表 的 索引 。 

由 于 Java 中 的 数组 是 完善 的 对 象 ，CONSTANT _ Class _ info 表 也 能 够 用 来 描述 数组 
类 。CONSTANT _Class_info 表 中 的 name_index 项 指向 CONSTANT _Utf8_info 表 ， 该 表 中 
包含 了 数组 的 描述 符 ， 描 述 符 可 作为 数组 类 的 名 称 。 例 如 ， 一 个 double[][] 数 组 类 型 的 类 名 
为 它 的 描述 符 [[D;netjini.core.llokup.ServiceItem[][] 数 组 类 型 的 类 名 为 它 的 描述 符 
[[[Lnetjinni/core/lookup/Serviceltem:;。 由 于 Java 数组 最 多 只 能 有 255 维 ， 数 组 描述 符 最 多 
只 能 有 255 个 引导 符 “[”。 
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6.5.7 CONSTANT_String_info 表 


固定 长 度 的 CONSTANT String info 表 用 来 存储 文字 字符 串 值 ， 该 值 亦 可 标识 为 类 
java.lang.String 的 实例 。 该 表 中 只 存储 文字 字符 串 值 ， 不 存储 符号 引用 。 表 6-10 列 出 了 
CONSTANT String info 表 的 格式 。 


表 6-10 CONSTANT_String_info 表 的 格式 


CONSTANT_String_info 表 中 各 项 的 具体 说 明 如 下 : 

口 tag: tag 项 的 值 为 CONSTANT String(8); 

口 string index: String index 项 给 出 了 包含 文字 字符 串 的 CONSTANT _Utf8 info 表 
的 索引 。 


6.5.8 CONSTANT_Fieldref_info 表 


固定 长 度 的 CONSTANT Fieldref info 表 描 述 了 指向 字段 的 符号 引用 。 表 6-11 列 出 了 
CONSTANT Fieldref info 表 的 格式 。 


表 6-11 CONSTANT_Fieldref_info 表 的 格式 


class_index 


CONSTANT Fieldref info 表 中 各 项 的 具体 说 明 如 下 : 

口 “ Tag: Tag 项 的 值 为 CONSTANT Fieldref(9); 

口 Class index : Class index 项 给 出 了 声明 被 引用 字段 的 类 或 者 接口 的 

CONSTANT _ Class info 入 口 的 索引 。 

需要 注意 的 是 ， 由 class_index 指定 的 CONSTANT Class_info 不 只 是 代表 类 ， 还 可 能 
代表 接口 。 尽 管 接口 中 能 够 声明 字段 ， 而 且 可 以 分 别 声明 为 公开 、 静 态 和 final 类 型 。 但 如 
前 所 述 ， 如 果 其 他 类 的 静态 final 字段 使 用 编译 时 的 常量 进行 初始 化 操作 ， 那 么 Class 文件 
不 包含 对 这 些 字段 的 符号 引用 。 但 是 ，Class 文件 可 以 包含 它 使 用 的 任何 这 些 静 态 final 字 
段 的 常量 值 的 复 本 。 例 如 ， 如 果 类 使 用 在 接口 中 声明 的 float 类 型 的 静态 final 字段 ， 而 且 
它 被 初始 化 为 编译 时 的 常量 ， 该 类 将 会 在 它 自己 的 存储 float 值 的 常量 池 中 拥有 一 个 
CONSTANT Float_info 表 。 但 是 如 果 该 接口 使 用 只 有 在 运行 时 才能 计算 出 的 表达 式 来 初始 
化 它 的 静态 final 字段 ， 那 么 在 使 用 该 字段 的 类 的 常量 池 中 ， 将 会 有 一 个 对 该 接口 中 的 字段 
进行 符号 引用 的 CONSTANT _ Fieldref info 表 。 

口 Name and type index: Name and type index 提供 了 CONSTANT NameAndType 
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info 入 口 的 索引 ， 该 入 口 提供 了 字段 的 简单 名 称 以 及 描述 符 。 


6.5.9 CONSTANT_Methodref_info 表 


固定 长 度 的 CONSTANT_Methodref info 表 使 用 符号 引用 来 描述 类 中 声明 的 方法 (不 包 
括 接口 中 的 方法 )。 表 6-12 列 出 了 CONSTANT Methodref info 表 的 格式 。 


表 6-12 CONSTANT_Methodref_info 表 的 格式 


名 称 


CONSTANT _Methodref info 表 中 各 项 的 具体 说 明 如 下 : 

口 “ Tag: Tag 项 的 值 为 CONSTANT_Methodref(10); 

口 Class index: Class index 项 给 出 了 声明 被 引用 方法 的 CONSTANT Class info 入 
口 的 索引 。 由 class_inex 所 指定 的 CONSTANT _ Class_info 表 必 须 为 类 ， 不 能 为 接 
口 。 指 向 接口 中 声明 的 方法 的 符号 引用 使 用 CONSTANT InterfaceMethodref 表 ; 

口 Name and type index: 提供 了 CONSTANT NameAndType info 入 口 的 索引 ， 该 
入 口 提供 了 方法 的 简单 名 称 以 及 描述 符 。 如 果 方 法 的 简单 名 称 开始 与 
“<”)(\u003c') 符 号 ， 该 方法 必须 为 一 个 实例 初始 化 方法 。 它 的 简单 名 称 必须 为 
<init>， 它 的 返回 值 必 2 void 类 型 。 否 则 ， 该 方法 的 名 称 必须 为 一 个 有 效果 的 
Java 程序 设计 语言 的 标识 


6.5.10 CONSTANT _InterfaceMethodref info 表 


固定 长 度 的 CONSTANT InterfaceMethodref info 表 使 用 符号 引用 来 描述 接口 中 声明 的 
方法 (不 包括 类 中 的 方法 )。 表 6-13 列 出 了 CONSTANT InterfaceMethodref info 表 的 格式 。 


表 6-13 CONSTANT_InterfaceMethodref_info 表 的 格式 


名 称 


| tag 


class_index 


Name and type index 


表 CONSTANT InterfaceMethodref info 中 各 项 的 具体 说 明 如 下 : 

口 tag: Tag 项 的 值 为 CONSTANT InterfaceMethodref(11); 

口 class_index: 此 项 给 出 了 声明 了 被 引用 方法 接口 CONSTANT _Class_info 的 入 口 索 
引 。 由 class index 所 指定 的 CONSTANT _ Class info 表 必 须 为 接口 ， 不 能 为 类 。 
在 类 中 生命 的 方法 的 符号 引用 使 用 CONSTANT Methodref 表 ; 

口 name and type index: 提供 了 CONSTANT NameAndType info 入 口 的 索引 ， 该 
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入 口 提供 了 方法 的 简单 名 称 以 及 描述 符 。 


6.5.11 CONSTANT_NameAndType _info 表 


固定 长 度 的 CONSTANT NameAndType info 表 构 成 了 指向 字段 或 者 方法 的 符号 引用 
的 一 部 分 。 该 表 提 供 了 所 引用 字段 或 者 方法 的 简单 名 称 和 描述 符 的 常量 池 入 口 。 表 6-14 列 
出 了 CONSTANT NameAndType info 表 的 格式 。 


表 6-14 CONSTANT_NameAndType_info 表 的 格式 


tag 
| name index 


descriptor index 


CONSTANT NameAndType info 表 中 各 项 的 具体 说 明 如 下 : 

口 tag: Tag 项 的 值 为 CONSTANT NameAndType(12); 

口 name index: 此 项 给 出 了 CONSTANT Utf8 info 入 口 的 索引 ， 该 入 口 给 出 了 字段 
或 者 方法 的 名 称 。 该 名 称 可 以 是 一 个 有 效 的 Java 程序 设计 语言 的 标识 符 ， 也 可 以 
是 <init>; 

口 descriptor index: 提供 了 CONSTANT _Utf8_info 入 口 的 索引 ， 该 入 口 提供 了 字段 
或 者 方法 的 描述 符 。 该 描述 符 必须 为 一 个 有 效 的 字段 或 者 方法 的 描述 符 。 


6.6 字 上 段 


在 类 或 者 接口 中 声明 的 每 一 个 字段 (类 变量 或 者 实例 变量 )， 都 由 Class 文件 中 的 一 个 名 
为 field_info 的 可 变 长 度 的 表 进行 描述 。 在 一 个 Class 文件 中 ， 不 会 存在 两 个 具有 相同 名 字 
和 描述 符 的 字段 。 需 要 注意 的 是 ， 尽 管 在 Java 程序 设计 语言 中 不 会 有 两 个 相同 名 字 的 字段 
存在 于 同一 个 类 或 者 接口 中 ， 但 一 个 Class 文件 中 的 两 个 字段 可 以 拥有 同一 个 名 字 一 一 只 
要 它们 的 描述 符 不 同 。 换 句 话说， 尽管 在 程序 设计 语言 中 ， 无 法 在 同一 个 类 或 者 接口 中 定 
义 两 个 具有 同样 名 字 和 不 同类 别 的 字段 ， 但 是 两 个 这 样 的 字段 却 可 以 同时 合法 地 出 现在 一 
个 Java Class 文件 中 。field_info 表 中 各 项 的 具体 说 明 如 下 。 

(1) Access_flags: 声明 字段 时 使 用 的 修饰 符 存放 在 字段 的 access_flags 项 中 。 

类 (不 包括 接口 ) 中 声明 的 字段 ， 只 能 拥有 ACC PUBLIC、ACC PRIVATE 、 
ACC PROTECTED 这 三 个 标志 中 的 一 个 ， 不 能 同时 设置 ACC FINAL 和 
ACC VOLATILE。 所 有 接口 中 声明 的 字段 必须 有 且 只 能 有 ACC PUBLIC、ACC STATIC 
和 ACC FINAL 这 三 种 标志 。 

Access flags 中 没有 用 到 的 位 都 被 设 为 0，Java 虚拟 机 实现 将 忽略 它们 。 

(2) Name index: 提供 了 给 出 字段 简单 名 称 (不 是 全 限定 名 ) 的 CONSTANT Utf8_info 
入 口 的 索引 。 在 Class 文件 中 的 每 一 个 字段 的 名 称 都 必须 符合 Java 程序 设计 语言 中 对 名 称 
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的 有 效 规定 。 
(3) Descriptor index: 提供 了 给 出 字段 描述 符 的 CONSTANT _Utf8_info 入 口 的 索引 。 
(4) Arrtibutes_count 和 attributes: attributes 项 是 由 多 个 attribute info 表 组 成 的 列表 。 
Attributes_count 指出 了 列表 中 attribute_info 表 的 数量 。 一 个 字段 在 其 列表 中 可 以 有 任意 数 
量 的 属性 。 由 Java 虚拟 机 规范 定义 的 三 种 可 能 会 出 现在 此 项 中 的 属性 是 : ConstantValue， 
Deprecated 和 Synthetic。jJava 虚拟 机 唯一 需要 识别 的 属性 是 ConstantValue 属性 。 虚 拟 机 实 
现 必须 忽略 任何 无 法 识别 的 属性 。 


he 


6.7 方 法 


在 Class 文件 中 ， 每 个 在 类 和 接口 中 声明 的 方法 ， 或 者 由 编译 器 产生 的 方法 ， 都 由 一 
个 可 变 长 度 的 method info 表 来 描述 。 同 一 个 类 中 不 能 存在 两 个 名 字 及 描述 符 完 全 相同 的 
方法 。 需 要 注意 的 是 ， 在 Java 程序 设计 语言 中 ， 尽 管 在 同一 个 类 或 者 接口 中 声明 的 两 个 方 
法 不 能 有 同样 的 特征 签名 ( 除 返 回 类 型 之 外 的 描述 符 )， 但 是 在 同一 个 Class 文件 中 ， 两 个 方 
法 可 以 拥有 同样 特征 的 签名 ， 前 提 是 它们 的 返回 值 不 能 相同 。 换 名 话说， 在 Java 源 文件 的 
同一 个 类 里 ， 如 果 声 明了 两 个 具有 相同 名 字 和 相同 参数 类 型 ， 但 返回 值 不 同 的 方法 ， 这 个 
程序 将 无 法 编译 通过 。 在 Java 程序 设计 语言 中 ， 不 能 仅仅 通过 返回 值 的 不 同 来 重 载 方法 。 
但 是 同样 的 两 个 方法 可 以 和 谐 地 在 一 个 Class 文件 中 共存 。 

有 可 能 在 Class 文件 中 出 现 的 两 种 编译 器 产生 的 方法 是 : 实例 初始 化 (名 为 <init>) 和 类 
与 接口 初始 化 方法 (名 为 <clinit>)。method_info 表 中 各 项 的 具体 说 明 如 下 。 

(1) Access_flags: 在 声明 方法 时 使 用 的 修饰 符 存 放 在 方法 的 access_flags 项 中 。 

类 (不 包括 接口 ) 中 声明 的 方法 只 能 拥有 ACC PUBLIC、ACC PROVATE、 
ACC_PROTECTED 这 三 个 标志 中 的 一 个 。 如 果 设 定 了 一 个 方法 的 ACC_ABSTRACT 标 
志 ， 那 么 它 的 ACC_PRIVATE、ACC STATIC、ACC FINAL、ACC SYNCHRONIZED、 
ACC_NATIVE 以 及 ACC_STRICT 标志 都 必须 清除 。 接 口中 声明 的 所 有 方法 必须 有 
ACC PUBLIC 和 ACC_ ABSTRACT 标志 。 除 此 以 外 ， 接 口 方法 不 能 使 用 其 他 标志 ， 但 接 
口 初 始 化 方法 (<clinit>) 可 以 使 用 ACC_STRICT 标志 。 

实例 初始 化 方法 (<init>) 可 以 只 使 用 ACC PUBLIC 、ACC PRIVATE 和 
ACC PROTECTED 标志 。 因 为 类 与 接口 初始 化 方法 (<clinit>) 只 由 Java 虚拟 机 直接 调用 ， 
永远 不 会 被 Java 字 节 码 直 接 调 用 ， 这 样 ，<clinit> 方 法 的 access_flags 中 的 标志 位 ， 除 去 
ACC STRICT 之 外 的 所 有 位 都 应 该 被 忽略 。 

在 access flags 中 没有 用 到 的 位 都 被 设 为 0，Java 虚拟 机 实现 也 将 忽略 它们 。 

(2) Name index: 提供 了 CONSTANT Utfg info 入 口 的 索引 ， 该 入 口 给 出 了 方法 的 简 
单 名 称 (不 是 全 限定 名 )。 在 Class 文件 中 的 每 一 个 方法 的 名 称 ， 都 必须 或 者 为 <init>， 或 者 
为 <clinit>， 或 者 是 Java 程序 设计 语言 中 有 效 的 方法 名 称 (简单 名 称 ， 不 是 全 限定 名 )。 

(3) descriptor index: 提供 了 CONSTANT Utf8 info 入 口 的 索引 ， 该 入 口 给 出 了 方法 
的 描述 符 。 
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(4) attributes 和 Attributes_count: attributes 项 是 由 多 个 attribute info 表 组 成 的 列表 。 
Attribute_ count 给 出 了 列表 中 attribute info 表 的 数量 。 一 个 字段 在 其 列表 中 可 以 有 任意 数 
量 的 属性 。 在 此 项 中 可 能 会 出 现 的 由 Java 虚拟 机 规范 定义 的 4 种 属性 是 Code、 
Deprecated、Exceptions 和 Synthetic。 这 4 种 属性 将 在 本 章 后 面 进一步 阐述 。Java 虚拟 机 只 
需要 识别 Code 和 Exception 属性 。 虚 拟 机 实现 必须 忽略 任何 无 法 识别 的 属性 。 


6.8 属 性 


Java class 文件 可 以 出 现在 ClassFile、field info、method info 和 Code attribute 表 中 。 
Code_attribute 表 本 身 即 为 一 个 属性 ， 在 Java 虚拟 机 规范 定义 了 9 种 属性 。 为 了 正确 地 解 
释 Java Class 文件 ， 所 有 Java 虚拟 机 实现 都 必须 能 够 识别 下 列 三 种 属性 ， 分 别 是 Code、 
ConstantValue 和 Exception。 为 了 正确 地 实现 Java 和 Java 2 平台 类 库 ， 虚 拟 机 实现 必须 能 
够 识别 InnerClasses 和 Synthetic 属性 ， 但 可 以 自主 选择 究竟 是 识别 还 是 忽略 其 他 一 些 与 定 
义 的 属性 。 

如 果 需 要 向 Java class 文件 中 加 入 新 的 属性 ， 除 Sun 公司 以 外 的 任何 人 都 必须 遵循 下 
列 两 个 步骤: 

(1) 任何 不 是 由 规范 进行 与 定义 的 属性 都 不 能 影响 类 或 者 接口 类 型 的 语义 。 新 的 属性 
只 能 向 Class 文件 添加 新 的 信息 ， 如 在 调试 过 程 中 用 到 的 信息 等 。 

(2) 属性 必须 使 用 与 Internet 域名 方案 颠倒 的 命名 方式 ，Internet 域名 方案 是 针对 Java 
语言 规范 中 包 的 命名 所 定义 的 。 例 如 ， 如 果 拥 有 一 个 Internet 域名 aaa.com， 而 需要 创建 的 
新 属性 为 CompilerVersion， 那 么 属性 则 应 该 命名 为 com.aaa.CompilerVersion。 


6.8.1 属性 格式 


属性 Attribute_ name_index 的 前 两 个 字 节 构成 了 到 CONSTANT_Utf8_info 表 的 常量 池 
的 索引 ， 表 CONSTANT Utf8 info 中 包含 了 属性 的 字符 串 名 称 。 因 此 ， 每 一 个 
attribute info 表 ， 由 其 表 中 的 第 一 项 指出 了 它 的 “类 型 ”。 

紧 随 attribute name _index， 后 面 是 4 字 节 长 的 attribute length 项 ， 它 给 出 除去 起 始 6 
个 字 节 后 整个 attribute info 表 的 长 度 (attribute length 项 可 以 为 0)。 因 为 只 要 遵循 一 定 规则 
(如 下 所 列 )， 任 何人 都 能 够 向 Java Class 文件 中 加 入 属性 ， 所 以 长 度 是 不 可 缺少 的 。Java 虚 
拟 机 实现 能 够 识别 新 属性 ， 实 现 必 须 忽略 任何 无 法 识别 的 属性 。 当 解析 Class 文件 时 ， 
attribute_ length 允许 虚拟 机 跳 过 无 法 识别 的 属性 。 

表 Attribute info 中 各 项 的 具体 说 明 如 下 : 

口 “Attribute name index 项 : 给 出 了 包含 属性 名 称 的 CONSTANT Utfg 入 口 的 常量 

池 的 索引 。 

口 “”Attribute lengthattribute length 项 : 给 出 了 属性 数据 的 长 度 (以 字 节 计 )， 但 是 包括 

attribute name index 和 attribute_ length 在 内 的 起 始 6 个 字 节 不 包括 在 内 。 

口 ”Info 项 : 包含 属性 数据 。 
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6.8.2 Code 属性 


在 可 变 长 度 的 Code attribute 表 中 ， 定 义 了 方法 的 字 节 码 序 列 和 其 他 信息 。 在 所 有 不 
是 抽象 或 者 本 地 方法 的 method info 信息 中 ， 都 存在 一 个 Code _ attribute 表 。 表 
Code_ attribute 中 各 项 的 具体 说 明 如 下 。 
Attribute name index 项 : 给 出 包含 字符 串 “Code” 的 CONSTANT Utf8 info 入 
口 的 常量 池 索 引 。 
Attribute length 项 : 给 出 除去 起 始 6 个 字 节 (包含 attribute name index 和 
attribute_length 项 ) 后 ，Code 属性 以 字 节 为 单位 的 长 度 。 
Max_stack: 在 方法 执行 中 的 任意 时 刻 ，max_stack 项 给 出 该 方法 的 操作 数 栈 的 最 
大 长 度 (以 字 节 为 单位 )。 
Max_locals 项 : 给 出 方法 的 局 部 变量 所 需 存储 空间 的 长 度 (以 字 为 单位 )。 无 论 虚 
拟 机 什么 时 候 调 用 被 Code 属性 所 描述 的 方法 ， 它 都 必须 分 配 一 个 长 度 为 
max_locals 的 局 部 变量 数组 。 这 个 数组 用 来 存储 传递 给 方法 的 参数 以 及 为 方法 所 
使 用 的 局 部 变量 。Long 或 者 double 类 型 值 的 最 大 有 效 的 局 部 变量 索引 是 
max_locals=2. 任 何其 他 类 型 值 的 最 大 有 效 局 部 变量 索引 为 max_locals=1. 

口 Code length 和 code: Code length 项 给 出 该 方法 字 节 码 流 的 长 度 ( 按 字 节 计 )。 字 
节 码 本 身 将 会 出 现在 code 项 中 。Code_length 的 值 必须 大 于 0。 

口 Exception table length 和 exception table : Exception table length 项 是 一 个 
exception info 表 的 列表 。 每 个 exception info 表 都 描述 了 一 个 异常 表 项 。 
Exception table length 项 给 出 了 exception table 中 exception info 表 的 数目 。 
Exception table 表 在 列表 中 按照 方法 执行 抛 出 异常 时 Java 虚拟 机 检查 匹配 异常 处 
理 器 (catch 子 句 ) 的 顺序 进行 排列 。 

口 Attributes count 和 attributes: Attributes 项 是 一 个 attribute info 表 的 列表 。 
Attributes_count 项 给 出 了 列表 中 attribute_info 表 的 数目 。 该 项 中 可 以 出 现 Java 虚 
拟 机 规范 所 定义 的 两 种 属性 : LineNumberTable 和 LocalVariableTable。Java 虚拟 
机 实现 允许 忽略 Code 属性 内 attributes 项 中 的 任何 属性 ， 如 果 Java 虚拟 机 无 法 识 
别 这 些 ，Java 虚拟 机 必须 忽略 它们 。 

固定 长 度 的 exception info 表 描 述 了 一 个 异常 表 项 ， 该 表 在 Code 属性 中 的 

exception_info 项 中 出 现 ， 它 是 exception_info 表 序 列 的 组 成 部 分 。 表 Exception info 中 各 项 
的 具体 说 明 如 下 。 

口 Start pc 项 : 给 出 从 代码 数组 起 始 处 到 异常 处 理 器 起 始 处 的 偏 移 量 。 

口 ”End pc 项 : 给 出 从 代码 数组 起 始 处 到 异常 处 理 器 结束 后 一 个 字 节 的 偏 移 量 。 

口 Handler pc 项 : 如 果 抛 出 的 异常 被 该 项 捕获 的 话 ， 则 给 出 一 条 从 代码 数组 起 始 处 
跳 转 到 异常 处 理 器 的 第 一 条 指令 偏 移 量 的 指令 。 

口 ”Catch type 项 : 给 出 被 该 异常 处 理 器 所 捕获 的 异常 类 型 的 CONSTANT_ Class info 
入 口 的 常量 池 索 引 。CONSTANT Class info 入 口 必须 描述 了 类 javalang. 
Throwable 或 其 子 类 。 
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如 果 catch type 的 值 为 0( 不 是 一 个 有 效 的 常量 池 索 引 ， 因 为 常量 池 从 索引 1 开始 )， 那 
么 异常 处 理 器 将 处 理 所 有 的 异常 。 一 个 值 为 0 的 catch type 用 于 事项 finally 子 句 。 


6.8.3 ”ConstantValue 属性 


固定 长 度 的 ConstantValue 属性 出 现在 值 为 常量 的 字段 的 field_ info 表 中 。 在 给 定 
field info 表 的 属性 项 中 ， 最 多 只 可 能 出 现 一 个 ConstantValue 属性 。 在 包含 ConstantValue 
属性 的 field info 表 内 的 access_flag 中 ， 必 须 设 定 ACC_STATIC 标志 。 尽 管 可 能 并 不 需 
要 ， 但 是 也 可 以 设 定 ACC_FINAL 标志 。 当 虚拟 机 初始 化 一 个 具有 ConstantValue 属性 的 
字段 时 ， 它 将 一 个 常量 值 赋 给 这 个 字段 。 赋 值 操作 的 虚拟 机 调用 声明 此 字段 的 类 或 者 接口 
的 初始 化 方法 之 前 进行 。 

表 ConstantValue_attribute 中 各 项 的 具体 说 明 如 下 。 

口 “”Attribute name index 项 : 给 出 包含 字符 串 “ConstantValue” 的 CONSTANT Utf8_ 

info 入 口 的 常量 池 索 引 。 

口 ”Attribute_length 项 : ConstantValue_attribute 中 的 attribute length 项 的 值 永远 为 2。 

口 “Constantvalue index 项 : 给 出 提供 常量 值 的 入 口 的 常量 池 索 引 。 


6.8.4 ”Deprecated 属性 


固定 长 度 的 Deprecated 属性 存在 于 field info 、method info 和 ClassFile 表 内 的 
attributes 项 中 ， 这 是 一 个 可 选 的 项 ， 它 指出 了 所 禁用 的 字段 、 方 法 或 者 类 型 。 这 里 禁用 的 
意思 是 尽管 一 个 字段 、 方 法 或 者 类 型 仍然 存在 于 执行 的 方法 中 ， 但 程序 员 永 远 再 不 会 用 到 
它 。 更 确切 地 说 ， 程 序 员 使 用 其 他 相近 的 字段 、 方 法 和 类 型 ， 而 不 会 使 用 所 禁用 的 项 。 

对 于 编译 器 、 虚 拟 机 或 者 用 来 读 取 class 文件 的 任何 工具 来 说 ， 都 可 以 使 用 属性 
Deprecated 来 通知 程序 员 程序 使 用 了 禁用 的 字段 、 方 法 或 者 类 型 。 从 JDK 1.1 版 本 开始 便 
引入 了 Deprecated 属性 ， 用 来 支持 javadoc 工具 使 用 的 文档 注释 中 的 @deprecated 标志 。 


6.8.5 “Exception 属性 


可 变 程度 的 Exception 属性 列 出 了 方法 可 能 抛 出 的 异常 。Exception_attribute 表 会 出 现 
在 每 一 个 可 能 抛 出 已 检 出 异常 的 方法 的 method info 表 中 。 
如 果 一 个 方法 是 RuntimeException、Error 或 者 是 在 方法 的 Exceptions 属性 中 所 列 出 的 
异常 的 实例 或 者 子 类 ， 那 么 它 应 该 只 抛 出 一 个 异常 。 尽 管 这 条 规则 应 该 是 被 Java 编译 器 强 
制 执行 ， 但 它 没有 被 Java 虚拟 机 强制 执行 。 因 此 为 了 Java 编译 器 ，Exceptions 属性 存在 于 
Java Class 文件 中 。 表 Exceptions_attribute 中 各 项 的 具体 说 明 如 下 。 
口 “Attribute name_index: 给 出 包含 字符 串 “Exceptions” 的 CONSTANT _Utfg_info 
入 口 的 常量 池 索 引 。 

口 ”Attribute length: 给 出 了 除去 起 始 6 个 字 节 (其 中 包含 Attribute name index 和 
Attribute length 项 ) 后 ，Exception attribute 的 长 度 ( 按 字 节 计算 )。 

口 Number of exceptioins 和 Exception index table: Exception index table 是 一 个 该 


fi db 
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方法 内 throws 子 句 所 声明 异常 的 常量 池 中 CONSTANT_Class_info 入 口 的 索引 的 
数组 。 换 句 话说 ，Exception_index_table 列 出 了 该 方法 可 能 抛 出 的 所 有 已 检 出 的 
异常 。Number_of exceptioins 项 指出 了 数组 中 索引 的 数目 。 


6.8.6 InnerClasses 属性 


可 变 长 度 的 InnerClasses 属性 对 名 字 、 访 问 标志 以 及 被 声明 为 成 员 的 任何 嵌入 类 型 的 
外 围 类 型 ， 或 者 用 别 的 方法 由 类 或 者 接口 陈述 的 类 型 (嵌入 类 型 不 是 包 中 的 成 员 ， 而 是 类 或 
者 接口 的 成 员 )。 如 果 类 或 者 接口 的 代码 指向 一 个 嵌入 类 型 ， 该 类 或 者 接口 的 常量 池 将 会 包 
含 一 个 用 于 此 嵌入 类 型 的 CONSTANT Class info 入 口 ， 这 些 嵌 入 类 型 被 定义 为 类 或 者 数 
组 的 直接 成 员 一 一 尽管 类 或 者 接口 并 没有 另外 描述 内 嵌 类 型 。 如 果 类 或 者 接口 的 常量 池 包 
含 让 你 和 内 媒 类 型 的 CONSTANT _ Class_ info 入 口 ， 那 么 此 类 或 者 接口 的 Class 文件 必须 包 
含 一 个 InnerClasses_attribute 表 。 此 表 存 在 于 它 自 身 的 ClassFile 表 的 attributes 项 中 。 


6.9 JVM 加载 Class 文件 的 原理 


Java 中 的 所 有 类 ， 必 须 被 装载 到 JVM 中 才能 运行 ， 这 个 装载 工作 是 由 JVM 中 的 类 装 
载 器 完成 的 ， 类 装载 器 所 做 的 工作 实质 是 把 类 文件 从 硬盘 读 取 到 内 存 中 。 本 节 将 简要 讲解 
JVM 加 载 Class 文件 的 基本 原理 。 


6.9.1 Java 中 的 类 文件 


Java 中 的 类 可 以 大 致 分 为 以 下 三 种 : 

口 ”系统 类 。 

口 扩展 类 。 

口 ” 由 程序 员 自 定义 的 类 。 

类 的 装载 方式 有 以 下 两 种 。 

口 ” 隐 式 装载 :程序 在 运行 过 程 中 当 碰 到 通过 new 等 方式 生成 对 象 时 ， 隐 式 调用 类 

装载 器 加 载 对 应 的 类 到 JVM 中 。 

口 “ 显 式 装 载 : 通过 class.fomame() 等 方法 ， 显 式 加 载 需要 的 类 。 

一 个 应 用 程序 总 是 由 n 个 类 组 成 ， 当 Java 程序 启动 时 ， 并 不 是 一 次 把 所 有 的 类 全 部 加 
载 后 再 运行 ， 它 总 是 先 把 保证 程序 运行 的 基础 类 一 次 性 加 载 到 JVM 中 ， 其 他 类 等 到 JVM 
用 到 的 时 候 再 加 载 ， 这 样 的 好 处 是 节省 了 内 存 的 开销 ， 因 为 Java 最 早 就 是 为 嵌入 式 系统 而 
设计 的 ， 这 是 一 种 可 以 理解 的 机 制 ， 而 用 到 时 再 加 载 这 也 是 Java 动态 性 的 一 种 体现 。 

Java 中 的 类 装载 器 实质 上 也 是 类 ， 功 能 是 把 类 载 入 JVM 中 ， 值 得 注意 的 是 JVM 的 类 
装载 器 是 三 个 ， 而 不 是 一 个 ， 具 体 层次 结构 如 下 : 

Bootstrap Loader - 负责 加 载 系统 类 


1 
一 - ExtClassLoader - 负责 加 载 扩 展 类 
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- - AppClassLoader - 负责 加 载 应 用 类 

使 用 三 个 类 加 载 器 的 原因 有 两 点 : 一 方面 是 分 工 ， 各 自负 责 各 自 的 区 块 ， 另 一 方面 为 
了 实现 委托 模型 ， 下 面 会 谈 到 该 模型 。 

因为 在 Java 中 有 三 个 类 加 载 器 ， 所 以 当 碰 到 一 个 类 需要 加 载 时 ， 需 要 面 对 如 何 协 调 工 
作 的 问题 ， 即 Java 是 如 何 区 分 一 个 类 该 由 哪个 类 加 载 器 来 完成 的 问题 。 在 这 里 Java 采用 
了 委托 模型 机 制 ， 这 个 机 制 简单 来 讲 ， 就 是 “类 装载 器 有 载 入 类 的 需求 时 ， 会 先 请 示 其 
Parent 使 用 其 搜索 路 径 帮 忙 载 入 ， 如 果 Parent 找 不 到 ， 那 么 才 由 自己 依照 自己 的 搜索 路 径 
搜索 类 ”。 

下 面 举 一 个 例子 来 说 明 ， 为 了 更 好 地 理解 ， 先 弄 清楚 几 行 代码 : 


Public class Test{ 
Public static void main(String[] arg){ 

ClassLoader c = Test.class.getClassLoader(); // 获 取 Test 类 的 类 加 载 器 
System.out.println(c); 

ClassLoader cl = c.getParent (); // 获 取 c 这 个 类 加 载 器 的 父 类 加 载 器 
System.out .println(cl)7 

ClassLoader c2 = cl.getParent () ;// 获 取 cl 这 个 类 加 载 器 的 父 类 加 载 器 
System.out.println(c2) 7 


运行 后 会 输出 : 
。。RppC1assLoader 
。。 ExtClassLoader 
Null 
由 此 可 以 看 出 ，Test 是 由 AppClassLoader 加 载 器 加 载 的 。AppClassLoader 的 Parent 
加 载 器 是 ExtClassLoader。Bootstrap Loader 是 用 C++ 语言 写 的 ， 根 据 Java 的 观点 来 看 ， 
逻辑 上 并 不 存在 Bootstrap Loader 的 类 实体 ， 所 以 在 Java 程序 代码 里 试图 打印 出 其 内 容 时 
会 看 到 输出 为 null。 
类 装载 器 ClassLoader( 一 个 抽象 类 ) 用 于 描述 JVM 加 载 Class 文件 的 原理 机 制 。 类 装载 
器 就 是 寻找 类 或 接口 字 节 码 文 件 进行 解析 并 构造 JVM 内 部 对 象 表示 的 组 件 ， 在 Java 类 装 
载 器 中 把 一 个 类 装 入 JVM 的 具体 步骤 如 下 : 
(1) 装载 : 查找 和 导入 Class 文件 。 
(2) 链接 : 其 中 解析 步骤 是 可 以 选择 的 。 
Q@ 检查 : 检查 载 入 的 Class 文件 数据 的 正确 性 。 
@ 准备 : 给 类 的 静态 变量 分 配 存储 空间 。 
@ 解析 : 将 符号 引用 转 成 直接 引用 。 
(3) 初始 化 : 对 静态 变量 ， 静 态 代码 块 执行 初始 化 工作 。 
类 装载 工作 由 ClassLoder 和 其 子 类 负责 ， 在 运行 JVM 时 会 产生 三 个 ClassLoader。 
口 ” 根 装载 器 : 不 是 ClassLoader 的 子 类 ， 由 C++ 编写 ， 因 此 在 java 中 看 不 到 他 ， 负 
责 装载 JRE 的 核心 类 库 ， 如 JRE 目录 下 的 rtjar、charsetsjar 等 。 
口 “ExtClassLoader: 扩展 类 装载 器 ， 是 ClassLoder 的 子 类 ， 负 责 装载 JRE 扩展 目录 


和 >> 


fi ava 
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ext 下 的 jar 类 包 。 

口 AppClassLoader: 负责 装载 classpath 路 径 下 的 类 包 。 

上 述 三 个 类 装载 器 存在 父子 层级 关系 ， 即 根 装 载 器 是 ExtClassLoader 的 父 装载 器 ， 
ExtClassLoader 是 AppClassLoader 的 父 装载 器 。 在 默认 情况 下 ， 使 用 AppClassLoader 装载 
应 用 程序 的 类 。 

Java 装载 类 使 用 “全 盘 负责 委托 机 制 ”。“ 全 盘 负责 ”是 指 当 一 个 ClassLoder 装载 一 
个 类 时 ， 除 非 显示 的 是 使 用 另外 一 个 ClassLoder， 该 类 所 依赖 及 引用 的 类 也 由 这 个 
ClassLoder 载 入 的 。“ 委 托 机 制 ” 是 指 先 委托 父 类 装载 器 寻找 目标 类 ， 只 有 在 找 不 到 的 情 
况 下 才 从 自己 的 类 路 径 中 查找 并 装载 目标 类 。 这 一 点 是 从 安全 方面 考虑 的 ， 试 想 如 果 一 个 
人 写 了 一 个 恶意 的 基础 类 (如 java.lang.String) 并 加 载 到 JVM 中 ， 这 将 将 会 引起 严重 的 后 
果 。 但 有 了 “全 盘 负责 制 ” 之 后 ，java.lang.String 永远 是 由 根 装载 器 来 装载 ， 避 免 了 以 上 
情况 的 发 生 

除了 JVM 默认 的 三 个 ClassLoder 以 外 ， 第 三 方 可 以 编写 自己 的 类 装载 器 ， 以 实现 一 
些 特殊 的 需求 。 当 类 文件 被 装载 解析 后 ， 在 JVM 中 都 有 一 个 对 应 的 java.lang.Class 对 象 ， 
提供 了 类 结构 信息 的 描述 。 数 组 、 枚 举 、 基 本 数据 类 型 甚至 void 都 拥有 对 应 的 Class 对 
象 。Class 类 没有 public 的 构造 方法 ，Class 对 象 是 在 装载 类 时 由 JVM 通过 调用 类 装载 器 中 
的 defineClass() 方 法 自动 构造 的 。 

ClassLoader 中 的 主要 方法 如 下 : 


public Class<?> loadClass (String name) 
throws ClassNotFoundException 
参数 “name” 用 于 指定 类 装载 器 需要 装载 类 的 名 字 ， 必 须 使 用 全 限定 类 名 。 该 方法 有 
一 个 重 载 方法 loadClass(String name,Boolean resolve)，resolve 参数 告诉 类 装载 器 是 否 解析 
该 类 。 在 初始 化 类 之 前 应 考虑 进行 类 解析 的 工作 ， 但 并 不 是 所 有 类 都 需要 解析 ， 如 果 JVM 
只 需要 知道 该 类 是 否 存在 或 找 出 该 类 的 超 类 ， 那 么 就 不 需要 进行 解析 。 


6.9.2 JVM 加 载 Class 文件 


当 我 们 使 用 命令 来 执行 某 一 个 Java 程序 时 ， 例 如 执行 Test.class 的 时 候 ， 有 具体 过 程 
如 下 。 

(1) java.exe 会 帮助 我 们 找到 JRE， 接 着 找到 位 于 JRE 内 部 的 jvm.dll ， 这 才 是 真正 
的 Java 虚拟 机 器 ， 最 后 加 载 动态 库 以 激活 Java 虚拟 机 器 。 

(2) 当 激 活 虚 拟 机 器 以 后 ， 会 先 做 一 些 初始 化 的 动作 ， 比 如 说 读 取 系统 参数 等 。 一 
初始 化 动作 完成 之 后 ， 就 会 产生 第 一 个 类 装载 器 一 一 Bootstrap Loader( 启 动 类 装载 器 )。 

(3) Bootstrap Loader 所 做 的 初始 工作 中 ， 除 了 一 些 基 本 的 初始 化 动作 之 外 ， 最 重要 的 
就 是 加 载 Launcherjava 之 中 的 ExtClassLoader( 扩 展 类 装载 器 )， 并 设 定 其 Parent 为 null， 代 
表 其 父 加 载 器 为 BootstrapLoader。 

(4) 然后 Bootstrap Loader 再 要 求 加 载 Launcherjava 之 中 的 AppClassLoader( 用 户 自 
定义 类 装载 器 )， 并 设 定 其 Parent 为 之 前 产生 的 ExtClassLoader 实体 。 这 两 个 加 载 器 都 是 
以 静态 类 的 形式 存在 的 。 


人 


第 6 章 详解 Class 文件 一 


在 此 需要 注意 的 是 ，Launcher$ExtClassLoader.class 与 Launcher$AppClassLoader.class 
都 是 由 Bootstrap Loader 所 加 载 ， 所 以 Parent 和 由 哪个 类 加 载 器 加 载 没有 关系 。 


1. 类 装载 器 体系 结构 


在 JVM 加 载 class 文件 时 必须 通过 一 个 叫做 类 装载 器 的 程序 ， 它 的 作用 就 是 从 磁盘 文 
件 中 将 要 运行 代码 的 字 节 码 流 加 载 进 内 存 (TVM 管理 的 方法 区 ) 中 。 下 面 是 几 个 比较 重要 的 

1) 启动 类 装载 器 

每 个 Java 虚拟 机 实现 都 必须 有 一 个 启动 类 装载 器 。 它 只 负责 在 系统 类 (核心 Java API 
的 Class 文件 ) 的 安装 路 径 中 查找 要 装 入 的 类 。 这 个 装载 器 的 实现 由 C++ 所 撰写 而 成 ， 是 
JVM 实现 的 一 部 分 。 

2) 扩展 类 装载 器 和 自 定义 类 装载 器 

负责 除 核心 Java API 以 外 的 其 他 Class 文件 的 装载 。 例 如 用 于 安装 或 下 载 标准 扩展 的 
class 文件 ， 在 类 路 径 中 发 现 的 类 库 的 Class 文件 ， 用 于 应 用 程序 运行 的 Class 文件 等 。 这 
里 有 一 点 需要 注意 ， 自 定义 类 装载 器 并 非 由 应 用 程序 员 自 己 实现 ， 它 也 是 JVM。 

3) 命名 空间 

Java 虚拟 机 为 每 一 个 类 装载 器 维护 一 个 唯一 标识 的 命名 空间 。 一 个 Java 程序 可 以 多 次 
装载 具有 同一 个 全 限定 名 的 多 个 类 。Java 虚拟 机 要 确定 这 “多 个 类 ”的 唯一 性 ， 因 此 当 多 
个 类 装载 器 都 装载 了 同名 的 类 时 ， 为 了 唯一 地 标识 这 个 类 ， 还 要 在 类 名 前 加 上 装载 该 类 的 
类 装载 器 的 标识 ， 指 出 了 类 所 位 于 的 命名 空间 。 

命名 空间 有 助 于 安全 的 实现 ， 因 为 可 以 有 效 地 在 装 入 了 不 同 命名 空间 的 类 之 间 设 置 一 
个 防护 单 。 在 Java 虚拟 机 中 ， 在 同一 个 命名 空间 内 的 类 可 以 直接 进行 交互 ， 而 不 同 的 命名 
空间 中 的 类 甚至 不 能 察觉 彼此 的 存在 ， 除 非 显 式 地 提供 了 允许 它们 进行 交互 的 机 制 。 一 旦 
加 载 后 ， 如 果 一 个 恶意 的 类 被 赋予 权限 访问 其 他 虚拟 机 加 载 的 当前 类 ， 它 就 可 以 潜在 地 知 
道 一 些 它 不 应 该 知道 的 信息 ， 或 者 干扰 程序 的 正常 运行 。 


2. 双亲 委托 模型 


用 户 自 定义 类 装载 器 经 常 依赖 其 他 类 装载 器 ， 至 少 依赖 于 虚拟 机 启动 时 创建 的 启动 类 
装载 器 来 帮助 它 实现 一 些 类 装载 请 求 。 在 JDK1.2 版 本 前 ， 非 启动 类 装载 器 必须 显 式 地 求 
助 于 其 他 类 装载 器 ， 类 装载 器 可 以 请 求 另 一 个 用 户 自 定义 的 类 装载 器 来 装载 一 个 类 ， 这 个 
请 求 是 通过 对 被 请 求 的 用 户 自 定义 类 装载 器 调用 loadClass() 来 实现 的 。 除 此 以 外 ， 类 装载 
器 也 可 以 通过 调用 findSystemClass() 来 请 求 启动 类 装载 器 来 装载 类 ， 这 是 类 ClassLoader 中 
的 一 个 静态 方法 。 

在 JDK1.2 及 其 以 后 的 版 本 中 ， 类 装载 器 请 求 另 一 个 类 装载 器 来 装载 类 型 的 过 程 被 形 
式 化 ， 这 被 称 为 双亲 委派 模式 。 从 JDK1.2 版 本 开始 ， 除 启动 类 装载 器 以 外 的 每 一 个 类 装 
载 器 外 ， 都 有 一 个 “双亲 ”类 装载 器 ， 在 某 个 特定 的 类 装载 器 试图 以 常用 方式 装载 类 型 以 
前 ， 它 会 先 默认 地 将 这 个 任务 “委派 ”给 它 的 双亲 一 一 请 求 它 的 双亲 来 装载 这 个 类 型 。 这 
个 双亲 再 依次 请 求 它 自己 的 双亲 来 装载 这 个 类 型 。 这 个 委派 的 过 程 一 直 向 上 继续 ， 直 到 达 
到 启动 类 装载 器 ， 通 常 启动 类 装载 器 是 委派 链 中 的 最 后 一 个 类 装载 器 。 如 果 一 个 类 装载 器 
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的 双亲 类 装载 器 有 能 力 来 装载 这 个 类 型 ， 则 这 个 类 装载 器 返回 这 个 类 型 。 否 则 ， 这 个 类 装 
载 器 试图 自己 来 装载 这 个 类 。 

当 Java 虚拟 机 开始 运行 时 ， 在 应 用 程序 开始 启动 以 前 ， 它 至 少 创建 一 个 用 户 自 定义 装 
载 器 ， 也 可 能 创建 多 个 。 所 有 这 些 装载 器 被 连接 在 一 个 Parent-Child 的 委托 链 中 ， 在 这 个 
链 的 顶端 是 启动 类 装载 器 。 
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Java 虚拟 机 通过 装载 、 连 接 和 初始 化 一 个 Java 类 型 ， 使 该 类 型 可 以 被 正 
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7.1 类 型 装载 、 连 接 和 初始 化 


Java 虚拟 机 通过 装载 、 连 接 和 初始 化 一 个 Java 类 型 ， 使 该 类 型 可 以 被 正在 运行 的 Java 
程序 所 使 用 。 具 体 功 能 如 下 。 

口 ” 装 载 : 功能 是 把 二 进 制 形式 的 Java 类 型 读 入 Java 虚拟 机 中 ， 

口 ”连接 : 功能 是 把 这 种 已 经 读 入 虚拟 机 的 二 进 制 形式 的 数据 合并 到 虚拟 机 运行 时 的 

状态 中 去 。 连 接 阶 段 分 为 3 个 子 步 又: 验 证、 准备 和 解析 。“ 验 证 ”步骤 确保 了 
Java 类 型 数据 格式 正确 并 且 适 于 Java 虚拟 机 使 用 ， 而 “准备 ”步骤 则 负责 为 该 类 
型 分 配 它 所 需 的 内 存 ， 比 如 ， 为 它 的 类 变量 分 配 内 存 ， “解析 ”步骤 则 负责 把 常 
量 池 中 的 符号 引用 转换 为 直接 引用 。 虚 拟 机 的 实现 可 以 推迟 解析 这 一 步 ， 它 可 以 
在 当 运 行 中 的 程序 真正 使 用 某 个 符号 引用 时 再 去 解析 它 (把 该 符号 引用 转换 为 直接 
引用 )。 当 验证 准备 和 (可 选 的 ) 解 析 步 骤 都 完成 了 时 ， 该 类 型 就 已 经 为 初始 化 做 好 
了 准备 。 

口 “ 初 始 化 : 在 此 期 间 ， 都 将 给 类 变量 赋 以 适当 的 初始 值 。 

上 述 装 载 、 连 接 和 初始 化 这 三 个 阶段 必须 按 顺序 进行 ， 唯 一 的 例外 就 是 连接 阶段 的 第 
三 步 一 一 解析 ， 它 可 以 在 初始 化 之 后 再 进行 

在 类 和 接口 被 装载 和 连接 的 时 机 上 ，Java 虚拟 机 规范 给 具体 实现 提供 了 一 定 的 灵活 
性 。 但 是 它 严格 定义 了 初始 化 的 时 机 。 所 有 的 Java 虚拟 机 实现 必须 在 每 个 类 或 接口 首次 主 
动 使 用 时 初始 化 。 下 面 这 6 种 情形 符合 主动 使 用 的 要 求 。 

(1) 当 创 建 某 个 类 的 新 实例 时 ， 或 者 通过 在 字 节 码 中 执行 new 指令 ， 或 者 通过 不 明确 
的 创建 、 反 射 、 克 隆 或 者 反 序列 化 时 。 

(2) 当 调 用 某 个 类 的 静态 方法 时 ， 即 在 字 节 码 中 执行 invokestatic 指令 时 。 

(3) 当 使 用 某 个 类 或 接口 的 静态 字段 ， 或 者 对 该 字段 赋值 时 。 即 在 字 节 码 中 ， 执 行 
getstatic 或 putstatic 指令 时 ， 用 final 修饰 的 静态 字段 除外 ， 它 被 初始 化 为 一 个 编译 时 的 常 
量 表达 式 。 

(4) 当 调 用 Java API 的 某 些 反射 方法 时 ， 比 如 ， 类 Class 中 的 方法 或 者 java.lang reflect 
包 中 的 类 的 方法 。 

(5) 当初 始 化 某 个 类 的 子 类 时 。 即 当初 始 化 某 个 类 时 ， 要 求 它 的 超 类 已 经 被 初始 
化 了 。 

(6) 当 虚 拟 机 启动 时 某 个 被 表明 为 启动 类 的 类 ， 即 含有 main() 方 法 的 那个 类 。 

除了 上 述 这 6 种 情形 外 ， 所 有 其 他 使 用 Java 类 型 的 方式 都 是 被 动 使 用 的 ， 他 们 都 不 会 
导致 Java 类 型 的 初始 化 。 

在 上 面 我 们 曾 提 到 ， 任 何 一 个 类 的 初始 化 都 要 求 它 的 超 类 在 此 之 前 已 经 初始 化 了 。 以 
此 类 推 ， 该 规则 就 意味 着 某 个 类 的 所 有 祖先 类 必须 在 该 类 之 前 被 初始 化 。 然 而 ， 对 于 接口 
来 说 ， 这 条 规则 并 不 适用 。 只 有 在 某 个 接口 所 声明 的 非常 量 字 段 被 使 用 时 ， 该 接口 才 会 被 
初始 化 ， 而 不 会 因为 实现 这 个 接口 的 子 接口 或 类 要 初始 化 而 被 初始 化 。 因 而 ， 任 何 一 个 类 


KE. 


第 7 章 栈 和 局 部 变量 操作 


的 初始 化 都 要 求 它 的 所 有 祖先 类 (而 不 是 祖先 接口 ) 预 先 被 初始 化 。 而 一 个 接口 的 初始 化 ， 
并 不 要 求 它 的 祖先 接口 预先 被 初始 化 。 

“在 首次 主动 使 用 时 初始 化 ”这 个 规则 直接 影响 着 装载 、 连 接 和 初始 化 类 的 机 制 。 在 
首次 主动 使 用 时 ， 其 类 型 必须 被 初始 化 。 然 而 ， 在 类 型 能 被 初始 化 之 前 ， 它 必须 已 经 被 连 
接 了 ， 而 在 它 能 被 连接 之 前 ， 它 必须 已 经 被 加 载 了 。Java 虚拟 机 的 实现 可 以 根据 需要 在 更 
早 的 时 候 装载 以 及 连接 类 型 ， 没 有 必要 一 直 要 等 到 该 类 型 的 首次 主动 使 用 采取 装载 和 连接 
它 。 无 论 如 何 ， 如 果 一 个 类 型 在 它 的 首次 主动 使 用 之 前 还 没有 被 装载 和 连接 的 话 ， 那 它 必 
须 在 此 时 被 装载 和 连接 ， 这 样 它 才 能 被 初始 化 。 


7.1.1 装载 


装载 阶段 由 三 个 基本 动作 组 成 ， 要 装载 一 个 类 型 ，Java 虚拟 机 必须 完成 如 下 三 个 基本 
动作 。 

(1) 通过 该 类 型 的 完全 限定 名 ， 产 生 一 个 代表 该 类 型 的 二 进 制 数据 流 。 

(2) 解析 这 个 二 进 制 数据 流 为 方法 区 内 的 内 部 数据 结构 。 

(3) 创建 一 个 表示 该 类 型 的 java.lang.Class 类 的 实例 。 

这 个 二 进 制 数据 流 可 能 遵守 java class 文件 格式 ， 但 是 也 可 能 遵守 其 他 的 格式 。 就 像 前 
一 章 提 到 的 那样 ， 所 有 的 Java 虚拟 机 实现 必须 能 识别 Java Class 文件 格式 ， 但 是 个 别 的 实 
现 也 可 以 识别 其 他 的 二 进 制 格式 。 

Java 虚拟 机 规范 并 没有 说 Java 类 型 的 二 进 制 数据 应 该 怎样 产生 。 下 面 是 一 些 可 能 的 产 
生 “ 类 型 的 二 进 制 数 据 ” 的 方式 。 

(1) 从 本 地 文件 系统 装载 一 个 Java Class 文件 。 

(2) 通过 网 络 传输 一 个 Java Class 文件 。 

(3) 从 一 个 ZIP、Jar、CAB 或 者 其 他 某 种 归档 文件 中 提取 Java Class 文件 。 

(4) 从 一 个 专 有 数据 库 中 提取 Java Class 文件 。 

(5) 把 一 个 Java 源 文 件 动态 编译 为 Class 文件 格式 。 

(6) 动态 为 某 个 类 型 计算 其 Class 文件 数据 。 

(7) 使 用 上 述 任何 方法 ， 但 是 使 用 不 同 于 Java Class 文件 的 其 他 二 进 制 文件 格式 。 

有 了 类 型 的 二 进 制 数据 之 后 ，Java 虚拟 机 必须 对 这 些 数据 进行 足够 的 处 理 ， 然 后 它 才 
能 创建 java.lang.Class 的 实例 对 象 。 虚 拟 机 必须 把 这 些 二 进 制 数据 解析 为 与 实现 相关 的 内 
部 数据 结构 。 装 载 步骤 的 最 终 产品 就 是 这 个 Class 类 的 实例 对 象 ， 它 成 为 Java 程序 与 内 部 
数据 之 间 的 接口 。 要 访问 关于 该 类 型 的 信息 (它们 是 存储 在 内 部 数据 结构 中 的 )， 程 序 就 要 
调用 该 类 型 对 应 的 Class 实例 对 象 的 方法 。 这 样 一 个 过 程 ， 就 是 把 一 个 类 型 的 二 进 制 数据 
解析 为 方法 区 的 内 部 数据 结构 ， 并 在 堆 上 建立 一 个 Class 对 象 的 过 程 ， 这 被 称 为 “创建 ” 
类 型 。 

Java 类 型 要 么 由 启动 类 装载 器 装载 ， 要 么 通过 用 户 自 定义 的 类 装载 器 装载 。 启 动 类 装 
载 器 是 虚拟 机 实现 的 一 部 分 ， 它 以 与 实现 无 关 的 方式 装载 类 型 (包括 JavaAPI 的 类 和 接 
口 )， 用 户 自 定义 的 类 装载 器 是 类 java.lang.ClassLoader 的 子 类 实例 ， 它 以 定制 的 方式 装 
六 类 。 
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类 装载 器 (启动 型 或 者 用 户 自 定义 的 ) 并 不 需要 一 直 等 到 某 个 类 型 “首次 主动 使 用 ”时 
再 去 装 入 它 。Java 虚拟 机 规范 允许 类 装载 器 缓存 Java 类 型 的 二 进 制 表现 形式 ， 在 预料 某 个 
类 型 将 要 被 使 用 时 就 装载 它 ， 或 者 把 这 些 类 型 装载 到 一 些 相关 的 分 组 里 面 。 如 果 一 个 类 装 
载 器 在 预先 装载 时 遇 到 问题 ， 无 论 如 何 ， 它 应 该 在 该 类 型 被 首次 主动 使 用 时 报告 该 问题 ( 通 
过 抛 出 一 个 LinkageError 异常 的 子 类 )。 换 名 话说， 如果 一 个 类 装载 器 在 预先 装载 时 遇 到 缺 
失 或 者 错误 的 class 文件 ， 它 必须 等 到 程序 首次 主动 使 用 该 类 时 才 报告 错误 。 如 果 这 个 类 
一 直 没 有 被 程序 主动 使 用 ， 那 么 该 类 装载 器 将 不 会 报告 错误 。 


7.1.2 验证 


当 类 型 被 装载 后 ， 就 准备 连接 了 。 连 接 过 程 的 第 一 步 是 验证 一 一 确认 类 型 符合 Java 语 
言 的 语义 ， 并 且 它 不 会 危及 虚拟 机 的 完整 性 。 

在 验证 上 ， 不 同 的 虚拟 机 实现 拥有 一 些 灵活 性 。 虚 拟 机 实现 的 设计 者 可 以 决定 如 何以 
及 何 时 验证 类 型 。Java 虚拟 机 规范 列 出 了 虚拟 机 可 以 抛 出 的 异常 以 及 在 何 种 条 件 下 必须 抛 
出 它们 。 不 管 Java 虚拟 机 可 能 遇 到 了 什么 样 的 麻烦 ， 都 应 该 有 一 个 异常 或 者 错误 可 以 抛 
出 。 规 范 表明 了 在 每 种 情形 下 应 该 抛 出 何 种 异常 或 者 错误 。 某 些 情况 下 ， 规 范 明确 地 说 明 
何 时 这 种 异常 或 者 错误 应 该 被 抛 出 ， 但 是 通常 没有 严格 地 规定 应 该 如 何 或 者 在 何 时 检查 错 
误 条 件 。 

不 管 怎样 ， 在 大 多 数 Java 虚拟 机 实现 中 特定 类 型 的 检查 一 般 都 在 特定 的 时 间 发 生 。 比 
如 ， 在 装载 过 程 中 ， 虚 拟 机 必须 解析 代表 类 型 的 二 进 制 数 据 流 ， 并 且 构 造 内 部 数据 结构 。 
这 个 时 候 ， 必 须 做 一 些 特定 的 检查 ， 以 保证 解析 二 进 制 数据 的 初始 工作 不 会 导致 虚拟 机 奔 
省。 在 这 个 解析 期 间 ， 虚 拟 机 大 多 会 检查 二 进 制 数据 以 确保 数据 全 部 是 预期 的 格式 。 
Javaclass 文件 格式 的 解析 器 可 能 检查 魔 数 ， 确 保 每 一 个 部 分 都 在 正确 的 位 置 ， 拥 有 正确 的 
长 度 ， 验 证 文件 不 是 太 长 或 者 太 短 ， 等 等 。 虽 然 这 些 检查 在 装载 期 间 完 成 ， 实 在 正式 的 连 
接 验 证 阶段 之 前 进行 ， 但 它们 仍然 在 逻辑 上 属于 验证 阶段 。 检 查 被 装载 的 类 型 是 否 有 任何 
问题 的 整个 过 程 都 属于 验证 。 

另外 一 个 很 可 能 在 装载 时 进行 的 检查 是 ， 确 保 除了 Object 之 外 的 每 一 个 类 都 有 一 个 超 
类 。 在 装载 时 检查 的 原因 是 当 虚 拟 机 装载 一 个 类 时 ， 它 必须 确保 该 类 的 所 有 超 类 都 已 经 被 
装载 了 。 对 于 给 定 的 类 ， 得 到 其 超 类 名 字 的 唯一 方法 就 是 观察 类 的 二 进 制 数据 。 因 为 Java 
虚拟 机 无 论 如 何 都 要 在 装载 的 时 候 检查 每 个 类 的 超 类 数据 ， 所 以 在 装载 阶段 做 这 个 检查 是 
顺理成章 的 。 

在 大 部 分 虚拟 机 实现 中 ， 还 有 一 种 检查 往往 发 生 在 正式 的 验证 阶段 之 后 ， 那 就 是 符号 
引用 的 验证 。 动 态 连接 的 过 程 包 括 通过 保存 在 常量 池 中 的 符号 引用 ， 这 些 被 引用 的 包括 
类 、 接 口 、 字 段 以 及 方法 ， 这 个 阶段 需要 把 符号 引用 蔡 换 成 直接 引用 。 当 虚拟 机 搜寻 一 个 
被 符号 引用 的 元 素 时 ， 它 必须 首先 确认 该 元 素 存 在 。 如 果 虚 拟 机 发 现 元 素 存在 ， 它 必须 进 
一 步 检查 引用 类 型 有 访问 元 素 的 权限 。 这 些 对 存在 性 和 访问 权限 的 检查 逻辑 上 是 验证 的 一 
部 分 ， 属 于 连接 的 第 一 阶段 ， 但 是 往往 在 解析 的 时 候 发 生 ， 那 是 连接 的 第 三 阶段 。 解 析 自 
身 也 可 能 延迟 到 符号 引用 第 一 次 被 程序 所 使 用 时 ， 所 以 这 些 检查 甚至 有 可 能 在 初始 化 之 后 
才 进 行 。 


CE 


he 


第 7 章 栈 和 局 部 变量 操作 


那么 在 正式 的 验证 阶段 做 哪些 检查 呢 ? 任何 在 此 之 前 还 没有 进行 的 检查 以 及 在 此 之 后 
不 会 被 检查 的 项 目 都 包含 在 内 。 在 此 首先 需要 列 出 确保 各 个 类 之 间 二 进 制 兼容 的 检查 。 

口 ” 检 查 final 的 类 不 能 拥有 子 类 。 

口 ”检查 final 的 方法 不 能 被 覆盖 。 

口 ”确保 在 类 型 和 超 类 型 之 间 没 有 不 兼容 的 方法 声明 (比如 两 个 方法 拥有 同样 的 名 字 ， 

参数 在 数量 顺序 、 类 型 上 都 相同 ， 但 是 返回 类 型 不 同 )。 

请 注意 ， 当 这 些 检 查 需 要 查看 其 他 类 型 的 时 候 ， 它 只 需要 查看 超 类 型 。 超 类 需要 在 子 
类 初始 化 前 被 初始 化 ， 所 以 这 些 类 应 该 已 经 被 装载 了 。 当 实现 了 父 接口 的 类 被 初始 化 的 时 
候 ， 不 需要 初始 化 父 接口 。 然 而 ， 当 实现 了 父 接口 的 子 类 (或 者 是 扩展 了 父 接口 的 子 接口 ) 
被 装载 时 ， 父 接口 也 必须 被 装载 。 它 们 不 会 被 初始 化 ， 只 是 被 装载 了 ， 可 能 被 某 些 虚拟 机 
实现 可 选 地 连接 了 。 当 装载 一 个 类 的 时 候 ， 它 所 有 的 超 类 都 会 被 装载 。 在 验证 期 间 ， 这 个 
类 和 它 所 有 的 超 类 型 都 需要 确保 互相 之 间 仍 然 二 进 制 兼容 。 

口 ”检查 所 有 的 常量 池 入 口 相互 之 间 一 致 。 比 如 ， 一 个 CONSTANT String info 入 口 

的 string_index 项 目 必须 是 一 个 CONSTANT_Utf8_info 入 口 的 索引 。 
口 ”检查 常量 池 中 的 所 有 的 特殊 字符 串 ， 例 如 检查 类 名 、 字 段 名 和 方法 名 、 字 段 描述 
符 和 方法 描述 符 是 否 符合 格式 。 

口 ” 检 查 字 节 码 的 完整 性 。 

上 面 列 出 的 最 复杂 的 任务 就 是 字 节 码 验 证 。 所 有 的 Java 虚拟 机 都 必须 设法 为 它们 执行 
的 每 个 方法 检验 字 节 码 的 完整 性 。 比 如 ， 不 能 因为 一 个 超出 了 方法 末尾 的 跳 转 指 令 就 导致 
虚拟 机 实现 崩溃 。 它 们 必须 在 字 节 码 验证 的 时 候 检查 出 这 样 的 跳 转 指令 是 非法 的 ， 从 而 抛 
出 一 个 错误 。 

虚拟 机 的 实现 没有 强求 在 正式 的 连接 验证 阶段 进行 字 节 码 验证 。 所 有 的 Java 虚拟 机 都 
必须 设法 为 它们 执行 的 每 个 方法 验证 字 节 码 的 完整 性 。 比 如 ， 不 能 因为 一 个 超出 了 方法 末 
尾 的 跳 转 指令 就 导致 虚拟 机 实现 崩溃 。 它 们 必须 在 字 节 码 验证 的 时 候 检查 出 这 样 的 跳 转 指 
令 是 非法 的 ， 从 而 抛 出 一 个 错误 。 

虚拟 机 的 实现 没有 强求 在 正式 的 连接 验证 阶段 进行 字 节 码 验证 。 比 如 ， 实 现 可 以 自由 
地 选择 在 执行 每 条 语句 的 时 候 单独 进行 验证 。 然 而 ，Java 虚拟 机 指令 集 设 计 的 一 个 目标 
就 是 使 得 字 节 码 流 可 以 通过 一 次 性 使 用 一 个 数据 流 分 析 器 进行 验证 。 在 连接 过 程 中 一 次 
性 验证 字 节 码 流 ， 而 非 在 程序 执行 的 时 候 动 态 验证 ， 使 得 Java 程序 的 运行 速度 得 到 很 大 的 
提高 。 

当 通 过 一 个 数据 流 分 析 器 进行 字 节 码 验证 的 时 候 ， 虚 拟 机 可 能 不 得 不 为 了 确保 符合 
Java 语言 的 语义 而 装载 其 他 的 类 。 比 如 ， 设 想 一 个 类 包含 了 一 个 方法 ， 其 中 把 一 个 
Java.lang 的 实例 的 引用 赋值 给 了 一 个 java.lang.Number 类 型 的 字段 。 在 这 个 情况 下 ， 虚 拟 
机 将 在 字 节 码 验 证 的 时 候 装载 类 Float。 确 保 这 是 一 个 Number 类 的 子 类 。 它 也 不 得 不 装载 
Number 来 确保 它 没有 被 声明 为 final。 虚 拟 机 此 时 不 需要 初始 化 Float， 只 需要 装载 它 ， 
Float 会 在 首次 主动 使 用 时 被 初始 化 。 


PE RT b> 


Bf jodibik 
名 


权衡 优化 、 高 效 和 安全 的 最 优 方 案 


7.1.3 准备 


随 着 Java 虚拟 机 装载 了 一 个 类 ， 并 执行 了 一 些 它 选择 进行 的 验证 之 后 ， 类 就 可 以 进入 
准备 阶段 了 。 在 准备 阶段 ，Java 虚拟 机 为 类 变量 分 配 内 存 ， 设 置 默认 初始 值 。 但 在 到 达 初 
始 化 阶段 之 前 ， 类 变量 都 没有 被 初始 化 为 真正 的 初始 值 。 在 准备 阶段 是 不 会 执行 Java 代码 
的 ， 此 阶段 虚拟 机 会 把 给 类 标量 新 分 配 的 内 存根 据 类 型 设置 默认 值 。 在 此 需要 注意 boolean 
类 型 ，Java 虚拟 机 不 太 支 持 这 一 类 型 。 在 内 部 的 boolean 常常 被 实现 为 一 个 int， 会 被 默认 
地 设置 为 0， 也 就 是 boolean 取 false 值 。 因 此 boolean 类 变量 ， 就 算 他 们 在 内 部 是 被 作为 
int 实现 的 ， 也 总 是 被 初始 化 成 false。 

在 准备 阶段 ，Java 虚拟 机 实现 可 能 也 为 一 些 数据 结构 分 配 内 存 ， 目 的 是 提高 运行 程序 
的 性 能 。 这 种 数据 结构 的 实例 如 方法 表 ， 它 包含 指向 类 中 每 一 个 方法 (包括 从 超 类 继承 的 方 
法 ) 的 指针 。 方 法 表 可 以 使 得 继承 的 方法 执行 时 不 需要 搜索 超 类 。 


7.1.4 解析 


当 类 型 经 过 验证 和 准备 这 两 个 阶段 之 后 ， 就 可 以 进入 第 三 个 (也 就 是 最 后 一 个 ) 连 接 阶 
段 : 解析 。 解 析 过 程 就 是 在 类 型 的 常量 池 中 寻找 类 、 接 口 、 字 段 和 方法 的 符号 引用 ， 把 这 
些 符号 引用 替换 成 直接 引用 的 过 程 。 


7.1.5 初始 化 


在 Java 代码 中 ， 一 个 正确 的 初始 值 是 通过 类 变量 初始 化 语句 或 者 静态 初始 化 语句 给 
出 的 。 
1. <clinit> 方 法 


所 有 的 类 变量 初始 化 语句 和 类 型 的 静态 初始 化 器 都 被 Java 编译 器 收集 在 一 起 ， 放 到 一 
个 特殊 的 方法 中 ， 称 为 类 初始 化 方法 。 在 类 和 接口 的 Java Class 文件 中 ， 这 个 方法 被 称 
为 ”<clinit>”。 通 常 的 Java 程序 方法 是 无 法 调用 这 个 <clinit> 方 法 的 ， 只 能 被 Java 虚拟 机 
调用 。 

初始 化 一 个 类 的 过 程 包含 以 下 两 个 步骤: 

(1) 如 果 类 存在 直接 超 类 的 话 ， 且 直接 超 类 还 没有 被 初始 化 ， 则 先 初 始 化 直接 超 类 。 

(2) 如 果 类 存在 一 个 类 初始 化 方法 (<clinit>) 就 执行 此 方法 。 

只 需 一 步 即 可 初始 化 一 个 接口 ， 如果 接 口 存 在 一 个 接口 初始 化 方法 的 话 ， 就 执行 此 方 
法 。 初 始 化 的 顺序 按照 类 变量 初始 化 语句 和 静态 初始 化 语句 出 现 的 顺序 初始 化 。 

并 不 是 所 有 的 类 都 需要 在 它 的 class 文件 中 有 一 个 <clinit>0 方 法 。 如 果 类 没有 声明 任何 
类 变量 ， 也 没有 静态 初始 化 语句 ， 那 么 它 就 不 会 有 <clinit>() 方 法 。 如 果 类 声明 了 类 变量 ， 
但 是 没有 明确 使 用 类 变量 初始 化 语句 或 者 静态 初始 化 语句 初始 化 它们 ， 那 么 类 也 不 会 有 
<clinit>() 方 法 。 

所 有 在 接口 中 声明 的 隐 式 公开 (Publicb、 静 态 (Staticj)、 最 终 (Final) 字 段 必须 在 字段 初始 
化 语句 中 初始 化 ， 如 果 接 口 包 含 任何 不 能 在 编译 时 被 解析 成 为 一 个 常量 的 字段 初始 化 语 
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句 ， 接 口 就 拥有 一 个 <clinit>0 方 法 。 例 如 : 


interface Examplef 
int ketchup = 5; 
int mustard= (int) (Math.random()*5.0); 
} 


ketchup 将 会 被 初始 化 为 一 个 编译 时 常量 ， 而 mustard 字段 被 方法 <clinit>0 初 始 化 。 
2. 主动 使 用 与 被 动 使 用 


当 使 用 一 个 非常 量 的 静态 字段 时 ， 只 有 这 个 字段 是 被 当前 类 或 接口 声明 的 情况 下 才 是 
主动 使 用 ， 如 果 是 子 类 使 用 父 类 中 声明 的 字段 ， 子 接口 和 实现 了 该 接口 的 类 使 用 此 接口 中 
的 字段 都 被 认为 是 被 动 使 用 ， 不 会 引发 初始 化 ， 例 如 : 


public class NewParent { 
static int hoursOfsleep = (int) (Math.random()*3.0); 
statict{ 
System.out .println ("NewParentwas initialized"); 
} 
» 
public class NewbornBaby extends NewParent { 
static int housOfCrying = 6+(int) (Math.random()*2.0); 
statict{ 
System.out.println ("NewbornBabywas initialized."); 
} 
public class Example { 
statict{ 
System.out.println ("Example wasinitialized."); 
} 
public static void main(String[] args) { 
int hours = NewbornBaby.hoursofsleep; 
System.out.println (hours); 


运行 结果 : 
Example was initialized. 


NewParent was initialized 


7.2 ”对象 的 生命 周期 


一 旦 一 个 对 象 被 装载 、 连 接 并 初始 化 之 后 ， 就 可 以 随时 使 用 它 了 。 程 序 可 以 访问 它 的 
静态 字段 ， 调 用 它 的 静态 方法 ， 或 者 创建 它 的 实例 。 在 Java 程序 中 ， 类 可 以 被 明确 或 者 隐 
含 的 实例 化 。 实 例 化 一 个 类 有 4 种 途径 : 明确 的 使 用 new 操作 符 ， 调 用 Class 或 者 
java.lang.reflect.Construtor 对 象 的 newInstance() 方 法 ， 调 用 任何 现 有 对 象 的 clone0 方 法 ,或 
者 通过 java.io.ObjectInputStream 类 的 getObjet( 方 法 反 序列 化 。 
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在 下 面 的 代码 中 演示 了 其 中 三 种 创建 新 的 类 实例 的 方法 : 


public class Example4 implements Cloneable { 
Example4(){ 
System.out.println ("Createdby invoking newInstance()!"); 
FE 
Example4 (Stringmsg) { 
System.out .println (msg); 
public static void main(String[]args) throws ClassNotFoundException, 
InstantiationException, 
IllegalAccessException,CloneNotSupportedException { 
Example4e4 = new Example4 ("created with new!"); 
ClassmycClass = Class.forName ("Example4"); 
Example4ob]j2 = (Example4) mycClass.newInstance () 7 
Example4ob]j3 = (Example4) obj2.clone(); 


} 
运行 后 会 打印 出 如 下 输出 : 


created with new! 
Created by invokingnewInstance()! 


除了 这 4 种 在 Java 源 代码 中 明确 地 实例 化 对 象 的 方法 之 外 ， 还 有 几 种 情况 下 对 象 会 被 
隐 含 地 实例 化 。 

在 任何 Java 程序 中 第 一 个 隐 含 实例 化 对 象 可 能 就 是 保存 命令 行 参数 的 String 对 象 。 每 
一 个 命令 行 参 数 都 会 有 一 个 String 对 象 的 引用 ， 把 它们 组 成 一 个 String 数组 并 作为 一 个 参 
数 传递 到 每 一 个 程序 的 main 方法 中 。 

另外 两 种 隐 含 实例 化 类 的 方法 和 类 装载 的 过 程 有 关 。 首 先 ， 对 于 Java 虚拟 机 装载 的 每 
一 个 类 型 来 说 ， 它 会 暗中 实例 化 一 个 Class 对 象 来 代表 这 个 类 型 。 其 次 ， 当 Java 虚拟 机 装 
载 了 在 常量 池 中 包含 CONSTANT _String_info 入 口 的 类 时 ， 它 会 创建 新 的 String 对 象 的 实 
例 来 表示 这 些 常量 字符 串 。 把 方法 区 中 的 CONSTANT String info 入 口 转换 成 一 个 堆 中 的 
String 实例 的 过 程 是 常量 池 解 析 过 程 的 一 部 分 。 

还 有 一 条 隐 含 创建 对 象 的 途径 是 通过 执行 包含 字符 串 操 作 符 的 表达 式 产 生 对 象 。 如 果 
这 样 的 字符 串 不 是 一 个 编译 时 常量 ， 用 于 中 间 处 理 的 String 和 StringBuffer 对 象 会 在 计算 
表达 式 的 过 程 中 创建 。 下 面 是 一 个 例子 。 


class Example5 { 
public static void main(String[]args) { 
if (args.length < 2) { 
System.out .println("mustenter any two arg") > 
return; 
} 
System.out .println(args[0]+ args[1]); 
} 
了 


Javac 为 上 述 Example5 的 main() 方 法 产生 了 下 面 的 字 节 码 : 


0 aload 0 //pushthe objref from loc var 0 (args) 
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1 arraylength //poparrayref, calc array length,push int length 
2 iconst 2 //push2 ints, compare, branch if (length>=2) to 
3 if icmpge 15 //offset 15 

//Push objref of string literal 
6 getstatic #11 <Field java.io.Printstreamout> 


//Push objref of string literal 
9 ldc #1 <String “must enter any two args”> 
//Pop objref to String param,objref to 
System.out, invoke Println() 
11 invokevirtual #12 <Method voidprintln(java.lang.string)> 
14 return //Return void from main() 
//Push objref from System.out 
15 getstatic #11 <Field java.io.Printstreamout> 
//The string concatenation operation begins here 
//Allocate mem for new StringBuffer object, and 
initialize mem to default initialvalues, push objref to new object. 
18 new #6 <Class java.lang.stringBuffer> 


21 dup //Duplicate objref to StringBuffer object 
22 aload 0 //Push ref from loc var 0 (args) 
23 iconst 0 //Push int constant 0 
//Pop int, arrayref, push String at arrayref[int] 
24 aaload //which is args[0] 


//Pop objref, invoke Stirng’s class method 
valueof (), passing it the objref tothe args[0] String object. Valueof() 
calls toString() on the ref, and returns (and pushes) the result, which 
happens to be the original args[0] String. Inthis case, the stack will 
look precisely the same. 


在 上 述 Example5 的 main() 方 法 的 字 节 码 中 ， 包 含 了 三 个 隐 含 创建 的 String 对 象 和 一 个 
StringBuffer 对 象 。 其 中 两 个 String 对 象 的 引用 作为 传递 到 main() 方 法 的 args 数组 的 一 部 
分 ， 是 通过 位 于 偏 移 量 为 24 和 33 的 aload 指令 压 入 栈 的 。StringBuffer 是 在 偏 移 量 为 18 
的 new 指令 创建 的 ， 被 偏 移 量 为 28 的 invokespecial 指令 初始 化 。 最 后 一 个 String 对 象 代 
表 args[0] 和 args[1] 的 连接 ， 是 通过 调用 StringBuffer 对 象 的 toString() 方 法 建立 的 ， 这 是 由 
位 于 偏 移 量 为 37 的 invokevirtual 指令 完成 的 。 

当 Java 虚拟 机 创建 一 个 类 的 新 实例 时 ， 不 管 是 明确 的 还 是 隐 含 的 ， 首 先 都 需要 在 堆 中 
为 保存 对 象 的 实例 变量 分 配 内 存 。 所 有 在 对 象 的 类 中 和 它 的 超 类 中 声明 的 变量 (包括 隐藏 的 
实例 变量 ) 都 要 分 配 内 存 。 堆 中 对 象 的 映像 中 其 他 一 些 与 实现 相关 的 元 素 ， 比 如 指向 方法 区 
中 类 数据 的 指针 ， 大 致 也 是 在 这 个 时 间 分 配 的 。 一 旦 虚拟 机 为 新 的 对 象 准备 好 了 堆 内 存 ， 
它 立 即 把 实例 变量 初始 化 为 默认 的 初始 值 。 

一 旦 虚拟 机 完成 了 为 新 对 象 分 配 内 存 和 为 实例 变量 赋 默 认 初 始 值 后 ， 它 随后 就 会 为 实 
例 变 量 赋 正 确 的 初始 值 。 根 据 创建 对 象 的 方法 不 同 ，Java 虚拟 机 使 用 三 种 技术 之 一 来 完成 
这 个 工作 。 如 果 对 象 是 通过 cloneO 调 用 来 创建 的 ， 虚 拟 机 把 原来 被 克隆 的 实例 变量 中 的 值 
复制 到 新 对 象 中 。 如 果 对 象 是 通过 一 个 ObjectmputStream 的 readObjectO 调 用 反 序 列 化 的 ， 
虚拟 机 通过 从 输入 流 中 读 入 的 值 来 初始 化 那些 非 暂 时 性 的 实例 变量 。 否 则 ， 虚 拟 机 调用 对 
象 的 实例 初始 化 方法 。 实 例 初 始 化 方法 把 对 象 的 实例 变量 初始 化 为 正确 的 初始 值 。 

Java 编译 器 为 它 编译 的 每 一 个 类 都 至 少 生 成 一 个 实例 初始 化 方法 。 在 Java 的 class 文 
件 中 ， 这 个 实例 初始 化 方法 被 称 为 “<init>”。 针 对 源 代码 中 每 一 个 类 的 构造 方法 ，Java 
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编译 器 都 产生 一 个 <ini>0 方 法 。 如 果 类 没有 明确 地 声明 任何 构造 方法 ， 编 译 器 默认 产生 一 
个 无 参数 的 构造 方法 ， 它 仅仅 调用 超 类 的 无 参数 构造 方法 。 和 其 他 的 构造 方法 一 样 ， 编 译 
器 在 class 文件 中 创建 一 个 <init>0 方 法 ， 对 应 它 的 默认 构造 方法 。 

一 个 <init>0 方 法 中 可 能 包含 三 种 代码 : 调用 另 一 个 <iniP>( 方 法 ， 实 现 对 任何 实例 变量 
的 初始 化 ， 构 造 方法 体 的 代码 。 如 果 构 造 方法 通过 明确 地 调用 同一 个 类 中 的 另 一 个 构造 方 
法 (一 个 this0 调 用 ) 开 始 ， 它 对 应 的 <init>0 方 法 由 两 部 分 组 成 : 

口 ”一 个 同类 的 <ini>0 方 法 的 调用 ， 任 意 实例 变量 初始 化 方法 的 字 节 码 ; 

口 一 个 超 类 的 <init>0 方 法 的 调用 ， 实 现 了 对 应 构造 方法 的 方法 体 的 字 节 码 。 

如 果 构 造 方法 没有 使 用 this0 调 用 开始 ， 并 且 这 个 类 是 Object， 上 面 类 表 中 的 第 一 个 元 
素 就 不 存在 。 因 为 Object 没有 超 类 ， 它 的 <init>0 方 法 就 不 能 通过 调用 超 类 的 <init>0) 方 法 
开始 。 

如 果 构 造 方法 通过 明确 地 调用 超 类 的 构造 方法 (一 个 super0 调 用 ) 开 始 ， 它 的 <init>0 方 
法 会 调用 对 应 的 超 类 的 <ini>0 方 法 。 比 如 ， 如 果 一 个 构造 方法 通过 明确 地 调用 

“super(int,String) 构 造 方法 ”开始 ， 对 应 的 <init>0 方 法 会 从 调用 超 类 的 “ <init>(int, 
String)” 方 法 开始 。 如 果 构 造 方法 没有 明确 地 从 this0 或 者 super0 调 用 开始 ， 对 应 的 <init>() 
方法 默认 会 调用 超 类 的 无 参数 <ini>0 方 法 。 

下 面 的 例子 包含 了 三 个 构造 方法 ， 编 号 从 1 到 3: 

public class Example6 { 

private int width = 3; 

// constructorone 

// Thisconstructor begins with a this() constructor invocation 
// which getscompiled to a same-class <init>() method incocation 
Example6(){ 


his (Ly 
System.out .println("Example6() ,width="” + width); 


// constructortwo 
// Thisconstructor begins with no explicit invocation of another 
// constructor 
// so it willget compiled to an <init>() method that begins with an 
// invocationof the 
// superclass's no-arg<init>() method. 
Example6 (int width) { 
this.width = width; 
System.out .println ("Exampleé6 (int),width=" + width); 
} 
WY 
Example6 (Stringmsg) { 
super (); 
System.out .println ("Exampleé6 (String) ,width=" + width); 
System.out .println (msg); 
} 
public static void main(String[]args) { 
Stringmsg = "The agapanthus is also know as Lily of the Nile"; 
Example6one = new Example6(); 
EXample6two = new Example6 (2); 
Example6three = new Example6 (msg); 
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执行 后 会 打印 如 下 输出 : 


Example6 (int) ，width=1 

Example6() ，width=1 

Example6 (int), width=2 

Example6 (String), width=3 

The agapanthus is also know as Lily of the Nile 


7.3 卸载 类 型 


在 很 多 方面 ，Java 虚拟 机 中 类 的 生命 周期 和 对 象 的 生命 周期 很 相似 。 虚 拟 机 创建 并 初 
始 化 对 象 ， 使 程序 能 使 用 对 象 ， 然 后 在 对 象 变 得 不 再 被 引用 后 可 选 地 执行 垃圾 收集 。 同 
样 ， 虚 拟 机 装载 ， 连 接 并 初始 化 类 ， 使 程序 能 使 用 类 ， 当 程序 不 再 引用 它们 的 时 候 可 选 地 
卸载 它们 。 


7.3.1 代 载 类 型 基础 


类 的 垃圾 收集 和 印 载 之 所 以 在 Java 虚拟 机 中 很 重要 ， 是 因为 Java 程序 可 以 在 运行 时 
通过 用 户 自 定 义 的 类 装载 器 装载 类 型 来 动态 地 扩展 程序 。 所 有 被 装载 的 类 型 都 在 方法 区 占 
据 内 存 空间 。 如 果 Java 程序 持续 通过 用 户 自 定义 的 类 装载 器 装载 类 型 ， 方 法 区 的 内 存 足 迹 
就 会 不 断 增 长 。 如 果 某 些 动态 装载 的 类 型 只 是 临时 需要 ， 当 它们 不 再 被 引用 之 后 ， 占 据 的 
内 存 空 间 可 以 通过 卸载 类 型 而 释放 。 

Java 虚拟 机 通过 何 种 方法 来 确定 一 个 动态 装载 的 类 型 是 否 仍然 被 程序 需要 呢 ， 其 判断 
方式 与 判断 对 象 是 否 仍 然 被 程序 需要 的 方式 很 类 似 。 如 果 程 序 不 再 引用 某 类 型 ， 那 么 这 个 
类 型 就 无 法 再 对 未 来 的 计算 过 程 产生 影响 。 类 型 变 成 不 可 触及 的 ， 而 且 可 以 被 垃圾 收集 。 

使 用 启动 类 装载 器 装载 的 类 型 永远 是 可 触及 的 ， 所 以 永远 不 会 被 卸载 。 之 后 使 用 用 户 
定义 的 类 装载 器 装载 的 类 型 才 会 变 成 不 可 触及 ， 从 而 被 虚拟 机 回收 。 如 果菜 个 类 型 的 Class 
实例 被 发 现 无 法 通过 正常 的 垃圾 收集 堆 触及 ， 那 么 这 个 类 型 就 是 不 可 触及 的 。 

判断 动态 装载 类 型 的 Class 实例 在 正常 的 垃圾 收集 过 程 中 是 否 可 以 触及 有 如 下 两 种 
方式 。 

口 第 一 种 : 是 最 明显 的 一 种 方式 ， 如 果 程 序 保持 对 Class 实例 的 明确 引用 ， 它 就 是 

可 触及 的 。 
口 第 二 种 : 如 果 在 堆 中 还 存在 一 个 可 触及 的 对 象 ， 在 方法 区 中 它 的 类 型 数据 指向 一 
个 Class 实例 ， 那 么 这 个 Class 实例 就 是 可 触及 的 。 


7.3.2 unreachable 状态 的 作用 


在 Java 虚拟 机 规范 中 ， 关 于 类 型 印 载 的 描述 含义 是 : 只 有 当 加 载 该 类 型 的 类 加 载 器 实 
例 ( 非 类 加 载 器 类 型 ) 为 unreachable 状态 时 ， 当 前 被 加 载 的 类 型 才 被 卸载 。 启 动 类 加 载 器 实 


PT p> [ 189 | 


例 永远 为 reachable 状态 ， 由 启动 类 加 载 器 加 载 的 类 型 可 能 永远 不 会 被 卸载 。 

由 此 可 以 看 出 ， 类 型 卸载 (Unloading) 仅 仅 是 作为 一 种 减少 内 存 使 用 的 性 能 优化 措施 存 
在 的 ， 具 体 和 虚拟 机 实现 有 关 ， 对 开发 者 来 说 是 透明 的 。 

纵 观 Java 语言 规范 及 其 相关 的 API 规范 ， 找 不 到 显示 类 型 务 载 的 接口 ， 也 就 是 说 : 

(1) 一 个 已 经 加 载 的 类 型 被 卸载 的 几率 很 小 ， 至 少 被 卸载 的 时 间 是 不 确定 的 ; 

(2) 一 个 被 特定 类 加 载 器 实例 加 载 的 类 型 运行 时 可 以 认为 是 无 法 被 更 新 的 。 

因为 如 果 想 和 抒 载 某 类 型 ， 必 须 保证 加 载 该 类 型 的 类 加 载 器 处 于 unreachable 状态 。 所 以 
从 某 种 程度 上 讲 ， 在 一 个 稍微 复杂 的 Java 应 用 中 ， 我 们 很 难 准确 判断 出 一 个 实例 是 否 处 于 
unreachable 状态 。 接 下 来 为 了 更 加 准确 的 逼近 这 个 所 谓 的 unreachable 状态 ， 我 们 用 一 个 简 
单 的 演示 代码 来 测试 。 

请 看 第 一 个 测试 : 使 用 自 定 义 类 加 载 器 加 载 ， 然 后 测试 将 其 设置 为 unreachable 的 状 
态 。 我 们 自 定义 类 加 载 器 ， 为 了 简单 起 见 ， 这 里 就 假设 加 载 当 前 工程 以 外 D 盘 某 文件 夹 的 
class。 然 后 假设 目前 有 一 个 简单 自 定义 类 型 MyClass 对 应 的 字 节 码 存在 于 D:/classes 目录 下 。 


public class MyURLClassLoader extends URLClassLoader { 
public MyURLClassLoader() { 
super (getMyURLs () ); 
} 
private static URL[] getMyURLs() { 
try { 
return new URL[] {new File ("D: /classes/") .toURL()}; 
} catch (Exception e) { 
e.printstackTrace (); 
return null; 
和 
} 


下 面 是 简单 的 测试 代码 : 


public class Main { 
public static void main(String[] args) { 
try { 
MyURLClassLoader classLoader = new MyURLClassLoader (); 
Class classLoaded = classLoader.loadClass ("MyClass"); 
System.out.println (classLoaded.getName ()); 
classLoaded = null; 
classLoader = null; 
System.out .println ("开始 GC"); 
System.gc(); 
System.out .println ("GC 完成 "); 
} catch (Exception e) { 
e.printstackTrace (); 
} 
} 
} 


然后 增加 虚拟 机 参数 -verbose:gc 来 观察 垃圾 收集 的 情况 ， 下 面 是 对 应 的 输出 : 


MyClass 
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开始 Gc... 

[Full GC[Unloading class MyClass] 
207K->131K (1984K), 0.0126452 secs] 
GC 完成 . 


接 下 来 看 第 二 个 测试 : 使 用 系统 类 加 载 器 加 载 ， 但 是 无 法 将 其 设置 为 unreachable 的 状 
态 。 在 此 将 场景 一 中 的 MyClass 类 型 字 节 码 文件 放置 到 工程 的 输出 目录 下 ， 以 便 系统 类 加 
载 器 可 以 加 载 。 


public class Main { 
public static void main(String[] args) { 
try { 
Class classLoaded = 
ClassLoader.getSystemClassLoader() .loadClass( 
"MyClass"); 


System.out.printl (sun.misc.Launcher.getLauncher() .getClassLoader ()); 
System.out.println (classLoaded.getClassLoader ()); 
System.out .println(Main.class.getClassLoader ()); 
classLoaded = null; 

System.out.printlin ("开始 GC"); 

System.gc(); 

System.out .println ("GC 完成 ") ; 

// 判 断 当 前 系统 类 加 载 器 是 否 有 被 引用 (是 否 是 unreachable 状态 ) 
System.out .println(Main.class.getClassLoader ()); 

} catch (Exception e) { 

e.printstackTrace (); 
} 
A 


和 前 面 的 第 一 个 测试 一 样 ， 通 过 增加 虚拟 机 参数 -verbose:gc 来 观察 垃圾 收集 的 情况 ， 
下 面 是 对 应 的 输出 : 

sun.misc.Launcher$AppClassLoader@197d257 

sun.misc.Launcher$AppClassLoader@197d257 

sun.misc.Launcher$AppClassLoader@197d257 

开始 Gc... 

[Ful1GC196K->131K(1984K)，0.0130748 secs] 

GC 完成 . . . 

sun.misc.Launcher$AppClassLoader@197d257 

由 于 系统 ClassLoader 实例 (AppClassLoader@197d257">sun.misc.Launcher$AppClass 
Loader(@197d257) 加 载 了 很 多 类 型 ， 而 且 又 没有 明确 的 接口 将 其 设置 为 null， 所 以 不 能 将 加 
载 MyClass 类 型 的 系统 类 加 载 器 实例 设置 为 unreachable 状态 。 通 过 测试 结果 可 以 看 出 ， 
MyClass 类 型 并 没有 被 卸载 ， 这 说 明 像 类 加 载 器 实例 这 种 较为 特殊 的 对 象 一 样 ， 一 般 在 很 
多 地 方 被 引用 ， 并 且 会 在 虚拟 机 中 呆 比 较 长 的 时 间 。 

接 下 来 看 第 三 个 测试 :使 用 扩展 类 加 载 器 加 载 ， 但 是 无 法 将 其 设置 为 unreachable 的 状 
态 。 在 此 将 前 面 第 二 个 测试 中 的 MyClass 类 型 字 节 码 文件 打包 成 jar 放置 到 JRE 扩展 目录 
下 ， 这 样 可 以 方便 扩展 类 加 载 器 可 以 加 载 的 到 。 因 为 下 面 的 标志 扩展 ClassLoader 实例 加 
载 了 很 多 类 型 ; 
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ExtClassLoader@7259da">sun.misc.Launcher$ExtClassLoader@7259da 


并 且 又 没有 明确 的 接口 将 其 设置 为 null， 所 以 不 能 将 加 载 MyClass 类 型 的 系统 类 加 载 
器 实例 设置 为 unreachable 状态 ， 所 以 通过 测试 结果 我 们 可 以 看 出 ，MyClass 类 型 并 没有 被 
外 载 。 

public class Main { 

public static void main(String[] args) { 
Ey 
Class classLoaded = 
ClassLoader.getSystemClassLoader () .getParent () 
-loadClass ("MyClass"); 
System.out.println (classLoaded.getClassLoader ()); 
classLoaded = null; 
System.out .println ("开始 GC"); 
System.gc(); 
System.out .println ("GC 完成 "); 
// 判 断 当 前 标准 扩展 类 加 载 器 是 否 有 被 引用 (是 否 是 unreachable 状态 ) 
System.out .println(Main.class.getClassLoader () .getParent () ) 7 
} catch (Exception e) { 
e.printstackTrace (); 
天 
} 
} 


接 下 来 同样 增加 虚拟 机 参数 -verbose:gc 来 观察 垃圾 收集 的 情况 ， 会 看 到 下 面 的 输出 : 


sun.misc.Launcher$ExtClassLoader@7259da 

开始 Gc... 

[Ful1GC199K->133K(1984K)，0.0139811 secs] 

GC 完成 . .. 

sun.misc.Launcher$ExtClassLoader@7259da 

通过 上 述 介绍 的 三 个 相关 测试 ， 针 对 印 载 类 型 可 以 作出 如 下 三 个 总 结 。 

(1) 在 整个 运行 期 间 ， 有 启动 类 加 载 器 加 载 的 类 型 是 不 可 能 被 卸载 的 。 

(2) 在 运行 期 间 ， 被 系统 类 加 载 器 和 标准 扩展 类 加 载 器 加 载 的 类 型 不 太 可 能 被 印 载 ， 
因为 系统 类 加 载 器 实例 或 者 标准 扩展 类 的 实例 基本 上 在 整个 运行 期 间 总 能 直接 或 者 间接 的 
访问 的 到 ， 其 达到 unreachable 的 可 能 性 极 小 。 但 是 在 虚拟 机 快 退出 的 时 候 可 以 ， 因 为 无 论 
ClassLoader 实例 或 者 Class(java.lang.Class) 实 例 也 都 是 在 堆 中 存在 ， 同 样 遵循 垃圾 收集 的 
规则 。 

(3) 被 开发 者 自 定义 的 类 加 载 器 实例 加 载 的 类 型 只 有 在 很 简单 的 上 下 文 环境 中 才能 被 
卸载 ， 而 且 一 般 还 要 借助 于 强制 调用 虚拟 机 的 垃圾 收集 功能 才 可 以 做 到 。 在 稍微 复杂 点 的 
应 用 场景 中 ， 尤 其 很 多 时 候 用 户 在 开发 自 定义 类 加 载 器 实例 的 时 候 ， 可 以 采用 缓存 的 策略 
以 提高 系统 性 能 。 被 加 载 的 类 型 在 运行 期 间 也 是 几乎 不 太 可 能 被 卸载 的 ， 至 少 秃 载 的 时 间 
是 不 确定 的 。 

由 此 可 见 ， 一 个 已 经 加 载 的 类 型 被 卸载 的 几率 很 小 至 少 被 扼 载 的 时 间 是 不 确定 的 。 同 
时 可 以 看 出 ， 开 发 者 在 开发 代码 的 时 候 ， 不 应 该 对 虚拟 机 的 类 型 逢 载 做 任何 假设 的 前 提 下 
来 实现 系统 中 的 特定 功能 。 
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在 运行 时 被 一 个 特定 类 加 载 器 实例 加 载 的 特定 类 型 是 无 法 被 更 新 的 ， 这 里 说 的 是 一 个 
特定 的 类 加 载 器 实例 ， 而 并 不 是 一 个 特定 的 类 加 载 器 类 型 。 接 下 来 请 读者 看 第 四 个 测试 场 
景 : 删除 前 面 已 经 放 在 工程 输出 目录 下 和 扩展 目录 下 的 对 应 的 MyClass 类 型 对 应 的 字 
节 码 。 


public class Main { 
public static void main(String[] args) { 
try { 
MyURLClassLoader classLoader = new MyURLClassLoader (); 
Class classLoaded]1 = classLoader.loadClass ("MyClass"); 
Class classLoaded2 = classLoader.loadClass ("MyClass"); 
// 判 断 两 次 加 载 classloader 实例 是 否 相同 
System.out .println(classLoadedl.getCclassLoader () == 
classLoaded2.getClassLoader () ) 
// 判 断 两 个 class 实例 是 否 相同 
System.out.println(classLoadedl == classLoaded2); 
} catch (Exception e) { 
e.printstackTrace (); 
3 
} 
} 


执行 后 会 输出 如 下 结果 : 


true 

true 

通过 上 述 结果 可 以 看 出 ， 两 次 加 载 获取 到 的 两 个 Class 类 型 实例 是 相同 的 ， 基 于 此 ， 
是 不 是 可 以 确定 是 我 们 的 自 定 义 类 加 载 器 真正 意义 上 加 载 了 两 次 呢 ? 通过 对 
java.lang.ClassLoader 的 loadClass(String name，boolean resolve) 方 法 进行 调试 ， 可 以 看 出 第 
二 次 加 载 并 不 是 真正 意义 上 的 加 载 ， 而 是 直接 返回 了 上 次 加 载 的 结果 。 

第 五 个 测试 场景 ， 同 一 个 类 加 载 器 实例 重复 加 载 同一 类 型 。 首 先 对 已 有 的 用 户 自 定义 
类 加 载 器 做 一 定 的 修改 ， 覆 盖 已 有 的 类 加 载 逻 辑 ， 修 改 类 MyURLClassLoaderjava 之 后 的 
代码 如 下 : 


public class MyURLClassLoader extends URLClassLoader { 
// 省 略 部 分 的 代码 和 前 面相 同 ， 只 是 新 增 如 下 覆盖 方法 


/ 

* 覆盖 默认 的 加 载 逻 辑 ， 如 果 是 D: /classes/ 下 的 类 型 每 次 强制 重新 完整 加 载 

* @see java.lang.ClassLoader#loadClass (java.lang.string) 

ee 

@Override 

public Class<?> loadClass (String name) throws 
ClassNotFoundException { 


try { 
// 首 先 调用 系统 类 加 载 器 加 载 


Class c = ClassLoader .getSystemClassLoader () .loadClass (name); 
return ec» 
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} catch (ClassNotFoundException e) { 


// 如 果 系 统 类 加 载 器 及 其 父 类 加 载 器 加 载 不 上 ， 则 调用 自身 逻辑 来 加 载 Dp: /classes/ 下 


的 类 型 


return this.findClass (name); 


, 
} 


在 上 述 代 码 中 ，this.findClass(name) 会 进一步 调用 父 类 URLClassLoader 中 的 对 应 方 
法 ， 其 中 涉及 到 了 defineClass(String name) 的 调用 ， 所 以 说 现在 类 加 载 器 
MyURLClassLoader 会 针对 “D:/classes/” 目 录 下 的 类 型 进行 真正 意义 上 的 强制 加 载 并 定义 
对 应 的 类 型 信息 。 此 时 重新 运行 第 四 个 测试 场景 代码 后 会 输出 : 


Exception in thread "main" java.lang.LinkageError: duplicate class 
definition: MyClass 

at java.lang.ClassLoader.defineClass]l (Native Method) 

at java.lang.ClassLoader.defineClass (ClassLoader .java: 620) 

at java.security.SecureClassLoader.defineClass (SecureClassLoader .java: 
124) 

at java.net.URLClassLoader.defineClass (URLClassLoader .java: 260) 

at java.net.URLClassLoader.access$100 (URLClassLoader.java: 56) 

at java.net.URLClassLoader$1.run (URLClassLoader .java: 195) 

at java.security.AccessController.doPrivileged (Native Method) 

at java.net.URLClassLoader.findClass (URLClassLoader.java: 188) 

at MyURLClassLoader.1loadClass (MYURLClassLoader.java: 51) 

at Main.main (Main.java: 27) 


由 此 可 以 看 出 ， 如 果 同 一 个 类 加 载 器 实例 重复 强制 加 载 (含有 定义 类 型 defineClass 动 
作 ) 相 同类 型 ， 会 引起 java.lang.LinkageError: duplicate class definition。 
第 六 个 测试 场景 ， 同 一 个 加 载 器 类 型 的 不 同 实例 重复 加 载 同一 类 型 。 


public class Main { 
public static void main(String[] args) { 

try { 
MyURLClassLoader classLoaderl = new MyURLClassLoader(); 
Class classLoadedl = classLoader]l .loadClass ("MyClass"); 
MyURLClassLoader classLoader2 = new MYURLC1assLoader () 7 
Class classLoaded2 = classLoader2.1oadClass ("MyClass"); 
// 判 断 两 个 Class 实例 是 否 相同 
System.out .println(classLoadedl == classLoaded2) 

} catch (Exception e) { 
e.printstackTrace () 

L 


} 
此 时 执行 后 会 输出 下 面 的 内 容 : 
false 


由 此 可 见 ， 由 不 同类 加 载 器 实例 重复 强制 加 载 (含有 定义 类 型 defineClass 动作 ) 同 一 类 
型 不 会 引起 java.lang.LinkageError 错误 ， 但 是 加 载 结果 对 应 的 Class 类 型 实例 是 不 同 的 ， 
即 实际 上 是 不 同 的 类 型 (虽然 包 名 + 类 名 相同 ) 如 果 强 制 转化 使 用 ， 会 引起 


外 < ee 
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ClassCastException 。 

我 们 在 开发 的 时 候 可 能 会 遇 到 这 样 的 需求 ， 就 是 要 动态 加 载 某 指 定 类 型 Class 文件 的 
不 同 版 本 ， 以 便 能 动态 更 新 对 应 功能 。 此 时 建议 大 家 不 用 等 待 指定 类 型 的 以 前 版 本 被 印 
载 ， 因 为 和 卸载 行为 对 Java 开发 人 员 是 透明 的 。 比 较 可 靠 的 做 法 是 ， 每 次 创建 特定 类 加 载 器 
的 新 实例 来 加 载 指定 类 型 的 不 同 版 本 ， 这 种 使 用 场景 下 ， 一 般 就 要 牺牲 缓存 特定 类 型 的 类 
加 载 器 实例 以 带 来 性 能 优化 的 策略 了 。 对 于 指定 类 型 已 经 被 加 载 的 版 本 ， 会 在 适当 时 机 达 
到 unreachable 状态 ， 被 unload 并 垃圾 回收 。 每 次 使 用 完 类 加 载 器 特定 实例 后 (确定 不 需要 
再 使 用 时 )， 将 其 显示 为 null， 这 样 可 能 会 比较 快 的 达到 JVM 规范 中 所 说 的 类 加 载 器 实例 
unreachable 状态 ， 增 大 已 经 不 再 使 用 的 类 型 版 本 被 尽快 卸载 的 机 会 。 

当 每 次 用 新 的 类 加 载 器 实例 去 加 载 指定 类 型 的 指定 版 本 ， 确 实 会 带 来 一 定 的 内 存 消 
耗 ， 一 般 类 加 载 器 实例 会 在 内 存 中 保留 比较 长 的 时 间 。 


7.4 常量 入 栈 操作 


因为 Java 虚拟 机 是 基于 栈 的 机 器 ， 所 以 几乎 所 有 Java 虚拟 机 的 指令 都 与 操作 数 栈 相 
关 。 栈 操作 包括 把 常量 压 入 操作 数 栈 、 执 行 通用 的 栈 操 作 、 在 操作 数 栈 和 局 部 变量 之 间 往 
返 传输 值 。 

和 栈 操作 相关 的 基本 指令 如 下 : 

口 store: 表示 弹出 操作 数 栈 (操作 数 栈 是 一 个 栈 ) 顶 的 数据 放 入 局 部 变量 区 ; 

口 store_ x: 表示 弹出 操作 数 栈 顶 的 数据 放 入 局 部 变量 区 索引 为 x 的 地 方 ; 

口 ”load: 表示 将 局 部 变量 区 中 某 个 位 置 ( 即 某 个 索引 ， 因 为 局 部 变量 区 是 一 个 数组 ) 的 
局 部 变量 压 入 操作 数 栈 ; 
load x: 表示 将 局 部 变量 区 中 x 位 置 的 局 部 变量 压 入 操作 数 栈 ; 
astore: 表示 弹出 操作 数 栈 项 的 对 象 引 用 ， 并 放 入 局 部 变量 区 ; 
astore x: 也 跟前 面 有 相同 的 规则 ; 
aload: 表示 将 局 部 变量 区 中 某 个 位 置 的 对 象 引 用 压 入 操作 数 栈 ; 
aload x: 也 跟前 面 有 相同 的 规则 ; 
const x: 表示 将 某 个 值 (x) 压 入 操作 数 栈 ; 
bipush x: 表示 将 某 个 值 (x*， 类 型 是 byte) 转 换 为 int 类 型 压 入 操作 数 栈 ; 
sipush x 表示 将 某 个 值 (x*， 类 型 为 short) 转 换 为 int 类 型 压 入 操作 数 栈 ; 
ldc x: 表示 将 常量 池 中 的 某 个 入 口 地 址 (x 表示 常量 池 入 口 地 址 ) 压 入 操作 数 栈 ; 
pop: 表示 将 操作 数 栈 顶部 的 数据 弹出 栈 ; 

口 ”dup: 表示 复制 操作 数 栈 项 的 数据 。 

为 了 演示 上 述 指令 的 作用 ， 我 们 可 以 使 用 jClassLib 工具 来 配合 ， 这 是 一 个 开源 的 分 析 
类 文件 内 容 的 工具 ， 可 以 从 网 上 下 载 ， 运 行 之 后 的 界面 如 图 7-1 所 示 。 
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操作 码 在 执行 常量 入 栈 操作 之 前 ， 使 用 三 种 方式 指明 常量 的 值 : 常量 值 隐 含 在 操作 码 
内 部 ， 常 量 值 在 字 节 码 中 如 同 操作 数 一 样 跟随 在 操作 码 之 后 ， 或 者 从 常量 池 中 取出 常量 。 
将 一 个 字 长 的 常量 压 入 栈 的 操作 说 明 如 表 7-1 所 示 。 


表 7-1 将 一 个 字 长 的 常量 压 入 栈 的 操作 说 明 


操作 码 说 明 
iconst_ ml 将 int 类 型 值 -1 压 入 栈 
iconst 0 将 int 类 型 值 0 压 入 栈 
iconst 1 将 int 类 型 值 1 压 入 栈 
iconst 2 将 int 类 型 值 2 压 入 栈 
iconst 3 将 int 类 型 值 3 压 入 栈 
iconst 4 将 int 类 型 值 4 压 入 栈 
iconst 5 将 int 类 型 值 5 压 入 栈 
feonst 0 将 float 类 型 值 0 压 入 栈 
fceonst_1 将 float 类 型 值 1 压 入 栈 
feonst 2 将 float 类 型 值 2 压 入 栈 

将 两 个 字 长 的 常量 压 入 栈 的 操作 说 明 如 表 7-2 所 示 。 
表 7-2 将 两 个 字 长 的 常量 压 入 栈 的 操作 说 明 

操作 码 说 明 
lconst 0 将 long 类 型 值 0 压 入 栈 
lconst 1 将 long 类 型 值 1 压 入 栈 
dconst 0 将 double 类 型 值 0 压 入 栈 
dconst 1 将 double 类 型 值 1 压 入 栈 
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如 果 给 一 个 对 象 引 用 赋 空 值 时 会 用 到 aconst_ null 指令 ， 将 空 aulD) 对 象 引 用 压 入 栈 的 说 
明 如 表 7-3 所 示 。 


表 7-3 将 空 (null) 对 象 引 用 压 入 栈 的 操作 说 明 


操作 码 说 明 


aconst null 将 空 (nulD 对 象 引用 压 入 栈 
请 看 下 面 的 演示 代码 : 


public class HelloWorld0l1 { 

/文大 

* @param args 

public static void main(String[] args) { 
int i0= 1; 
nt 10; 
int 12 = 0 + E17 
System.out .println (i2); 

} 


} 
对 应 的 方法 的 指令 如 下 : 


D iconst_1 
1 istore_l 

2 bipush 10 

4 istore_2 

5 iload_1 

6 iload_2 

7 iadd 

B istore_3 

9 getstatic $16 <java/lang/System. out> 

12 iload_3 

13 invokevircual $¥22 <java/io/PrintStream. println> 
16 return 


上 述 指令 的 具体 说 明 如 下 : 

口 ”inti0=1: 目标 是 给 变量 i0 赋值 ; 

口 iconst 1: 意思 是 将 1 这 个 值 压 入 操作 数 栈 ; 

口 istore_ 1: 意思 是 将 操作 数 栈 顶 的 数据 ( 即 刚 压 进去 的 值 1) 弹 出 并 存储 在 变量 区 中 
索引 为 1 的 地 方 ; 

口 bipush 10: 意思 是 将 10 压 入 操作 数 栈 ; 

口 istore 2: 意思 是 将 操作 数 栈 项 的 数据 ( 即 刚 压 进去 的 10) 弹 出 并 存储 在 变量 区 中 索 

引 为 2 的 地 方 ; 

iload_1: 表示 将 变量 区 中 索引 为 1 的 值 压 入 操作 数 栈 (这 个 值 就 是 1); 

iload 2: 表示 将 变量 区 中 索引 为 2 的 值 压 入 操作 数 栈 ( 这 个 值 就 是 10); 

iadd: 表示 将 操作 数 栈 中 的 两 个 数 弹 出 相 加 ， 并 将 结果 压 入 操作 数 栈 中 ; 

istore 3: 表示 将 操作 数 栈 项 的 数据 ( 即 在 iadd 操作 码 中 压 进去 的 相 加 之 后 的 结果 ) 

弹出 并 存储 在 变量 区 中 索引 为 3 的 地 方 。 
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从 上 面 的 分 析 可 以 看 到 ， 例 如 1 和 10 之 类 常量 值 ， 编 译 器 可 以 直接 将 它们 放 在 指令 
序列 中 。 
请 读者 再 看 下 面 的 代码 : 


public class HelloWorld02 { 


. 


/** 

* @param args 

区 

public static void main(String[] args) { 
long i0 = 100; 
long il = 999999999L; 
long i2 = i0 + il; 
System.out.println (i2); 

1 


对 应 的 指令 序列 为 : 


10 
ll 
13 
16 
lB 
21 


ldc2_w 其 16 “100> 

lstore_l 

ldc2_w #1B <999999999> 

lstore_3 

lload_1 

lload_3 

ladd 

lstore 5 

gotstatic #20 Cjava/lang/Systea. out> 
lload 5 

invokevirtual 其 26 <java/io/PrintStream. println> 
IeQturn 


上 述 指 令 的 具体 说 明 如 下 : 


口 


口 
口 
口 


口 
口 
口 


ldc2_w #16: 表示 将 常量 池 16 号 的 值 压 入 操作 数 栈 ， 两 个 字 长 (一 个 字 长 是 32 位 ) 
的 宽度 ; 

lstore 1: 表示 将 操作 数 栈 项 的 数据 弹出 放 到 变量 区 索引 号 为 1 的 地 方 ; 

ldc2_w #18: 表示 将 常量 池 18 号 的 值 压 入 操作 数 栈 ; 

lstore 3: 表示 将 操作 数 栈 项 的 数据 弹出 放 到 变量 区 索引 号 为 3 的 地 方 。 之 所 以 放 
到 索引 号 为 3 而 不 是 2 的 地 方 ， 是 因为 一 个 Long 占据 了 两 个 字 长 ， 即 两 个 索 
引号 ; 

lload_1 和 1lload 3: 表示 将 变量 区 索引 号 为 1 和 3 的 两 个 值 压 入 操作 数 栈 ; 

ladd: 表示 将 操作 数 栈 中 的 两 个 数据 弹出 并 相 加 ， 结 果 再 次 入 栈 ; 

lstore 5: 表示 将 操作 数 栈 顶 的 数据 ( 即 刚才 相 加 的 计算 结果 ) 弹 出 ， 并 放 到 变量 区 
索引 号 为 5 的 地 方 。 


从 上 面 的 分 析 可 知 ， 对 于 比较 大 的 数据 ， 编 译 器 会 把 这 些 数据 放 到 常量 池 中， 在 指令 
序列 中 则 仅 指明 位 置 而 已 。 
再 看 下 面 的 代码 : 


public class HelloWorld03 { 


WW 
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* @param args 
中 枚 
public static void main(String[] args) { 
String stringvaluel = "H"; 
String stringvlaue2 = "H"; 
String stringvalue3 = "Hello"; 
char c= "H'; 


} 


对 应 的 指令 序列 为 : 
ldc #16 <H> 
astore_l 

ldc #16 <H> 
astore_2 

ldc #1B <Hello> 
3store_3 

8 bipush 72 

11 istore 4 

13 return 


通过 上 面 例子 可 以 看 出 ， 字 符 串 也 是 放 到 常量 池 中 的 ， 而 且 相同 的 字符 串 在 常量 池 中 
只 有 一 份 。 字 符 则 把 它 当 成 是 一 个 int 类 型 压 入 到 操作 数 栈 中 。 
请 读者 再 看 下 面 的 代码 : 


public class HelloWorld05 { 
/** 
* Q@param args 
下 
public static void main(String[] args) { 
int result = 0; 
for (int i=0; i<10; i++){ 
result = result + i; 
} 


} 
对 应 的 指令 为 : 


D iconsr_0 

1 istore_l 

2 iconst_0 

3 istore_2 

4 goto 14 (+10) 
7 iload_1 

B iload_2 

8 iadd 

1D iscore_l 

1l1 iinc 2 by 1 
14 iload_2 

15 bipush 10 

17 if_icmplt 了 【11 
2D return 
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上 述 指令 的 具体 说 明 如 下 : 

口 iconst 0: 表示 将 0 压 入 操作 数 栈 ; 

口 istore 1: 表示 将 栈 顶 数据 弹出 存放 到 变量 区 ， 索 引号 为 1( 即 给 result 这 个 变量 
赋值 ); 

口 iconst 0: 表示 将 0 压 入 操作 数 栈 ; 

口 istore 2: 表示 将 栈 顶 数据 弹出 存放 到 变量 区 ， 索 引号 为 2( 即 给 i 这 个 变量 赋值， 
int 1=0); 

口 ”goto 14: 表示 跳 到 14 行 去 。 在 14 行 中 ，iload 2 表示 把 变量 区 索引 号 为 2 的 值 压 
入 操作 数 栈 ( 即 取出 i 变量 ); 

口 ”bipush 10: 表示 把 10 这 个 值 压 入 操作 数 栈 ; 

口 让 icmplt 7: 表示 弹出 操作 数 栈 的 两 个 数据 ， 并 判断 操作 数 栈 中 的 两 个 数 的 大 小 
( 即 是 否 i<10? )， 如 果 是 ， 则 跑 到 第 7 行 ， 否 则 ， 直 接 往 下 执行 了 。 在 第 7 行 
中 ，iload_1 即 把 变量 区 索引 号 为 1 的 值 压 入 操作 数 栈 ( 即 result 变量 ); 

口 iload 2: 表示 把 变量 区 索引 号 为 2 的 值 压 入 操作 数 栈 ( 即 i 变量); 

口 iadd: 把 两 个 操作 数 栈 中 的 数据 弹出 并 相 加 ， 把 结果 重新 压 入 操作 数 栈 ; 

口 istore 1: 表示 把 操作 数 栈 中 的 数据 弹出 ， 并 存放 到 变量 区 索引 号 为 1 的 地 方 ( 即 
更 新 了 result 变量 的 值 ); 

口 iinc 2 by 1: 表示 的 是 将 变量 区 索引 号 为 2 的 值 自 增 1; 

口 ”最 后 到 了 14 行 ， 将 重复 上 述 的 过 程 。 

常量 值 可 以 在 字 节 码 中 跟随 在 操作 码 之 后 ， 例 如 ， 将 byte 和 short 类 型 常量 压 入 栈 的 

操作 如 表 7-4 所 示 。 


表 7-4 将 byte 和 short 类 型 常量 压 入 栈 的 操作 说 明 


一 个 byte 类 型 的 数 将 byte 类 型 的 数 转换 为 mt 类 型 的 数 ， 然 后 压 入 栈 
二 个 short 类 型 的 数 将 short 类 型 的 数 转换 为 int 类 型 的 数 ， 然 后 压 入 栈 


从 常量 池 中 取出 常量 的 操作 说 明 如 表 7-5 所 示 。 
表 7-5 从 常量 池 中 取出 常量 的 操作 说 明 


说 明 
从 由 indexbyte 指向 的 常量 池 入 口中 取出 一 个 字 长 的 
值 ， 然 后 将 其 压 入 栈 
从 由 indexshort 指向 的 常量 池 入 口中 取出 一 个 字 长 的 
值 ， 然 后 将 其 压 入 栈 
从 由 indexshort 指向 的 常量 池 入 口中 取出 两 个 字 长 的 
值 ， 然 后 将 其 压 入 栈 


无 符号 8 位 数 indexbyte 


无 符号 16 位 数 indexshort 
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常量 池 索 引 ，Java 虚拟 机 通过 给 定 的 索引 查找 相应 的 常量 池 入 口 ， 决 定 这 些 常量 的 类 型 和 
值 ， 并 把 它们 压 入 栈 。 

常量 池 索 引 是 一 个 无 符号 值 ，ldc 和 ldc_w 是 把 一 个 字 长 的 项 压 入 栈 ， 区 别 是 ldc 的 索 
引 只 有 一 个 8 位 ， 只 能 指向 常量 池 中 1 一 255 范围 的 位 置 。ldc_w 的 索引 有 16 位 ， 可 以 指 
向 1 一 65535 范围 的 位 置 。 


而 通用 栈 操作 的 说 明 如 表 7-6 所 示 。 
表 7-6 通用 栈 操作 的 说 明 


操作 码 操作 数 说 明 

nop (无 ) 不 做 任何 操作 

pop (无 ) 从 操作 数 栈 弹出 栈 项 部 的 一 个 字 

pop2 (无 ) 从 操作 数 栈 弹出 最 顶端 的 两 个 字 

SWap (无 ) 交换 栈 项 部 的 两 个 字 

dup (©5) 复制 栈 项 部 的 一 个 字 

dup2 (元 ) 复制 栈 项 部 的 两 个 字 

(E) 复制 栈 顶 部 的 一 个 字 ， 并 将 复制 内 容 及 原来 弹出 的 两 
_ 个 字 长 的 内 容 压 入 栈 

二 (E) 复制 栈 顶 部 的 一 个 字 ， 并 将 复制 内 容 及 原来 弹出 的 三 
= 个 字 长 的 内 容 压 入 栈 

a 而 复制 栈 顶 部 的 两 个 字 ， 并 将 复制 内 容 及 原来 弹出 的 三 
国 个 字 长 的 内 容 压 入 栈 

有 而 复制 栈 顶 部 的 两 个 字 ， 并 将 复制 内 容 及 原来 弹出 的 四 
于 个 字 长 的 内 容 压 入 栈 


把 局 部 变量 压 入 栈 的 操作 说 明 如 表 7-7 所 示 。 
表 7-7 将 一 个 字 长 的 局 部 变量 压 入 栈 的 操作 说 明 


操作 码 操作 数 说 明 
iload Vindex 将 位 置 为 vindex 的 int 类 型 的 局 部 变量 压 入 栈 
iload 0 (无 ) 将 位 置 为 0 的 int 类 型 的 局 部 变量 压 入 栈 
iload 1 (无 ) 将 位 置 为 1 的 int 类 型 的 局 部 变量 压 入 栈 
iload 2 (无 ) 将 位 置 为 2 的 int 类 型 的 局 部 变量 压 入 栈 
iload 3 (无 ) 将 位 置 为 3 的 int 类 型 的 局 部 变量 压 入 栈 
fload Vindex 将 位 置 为 vindex 的 float 类 型 的 局 部 变量 压 入 栈 
fload 0 (无 ) 将 位 置 为 0 的 float 类 型 的 局 部 变量 压 入 栈 
fload 1 (无 ) 将 位 置 为 1 的 float 类 型 的 局 部 变量 压 入 栈 
fload 2 (无 ) 将 位 置 为 2 的 float 类 型 的 局 部 变量 压 入 栈 
fload 3 (无 ) 将 位 置 为 3 的 float 类 型 的 局 部 变量 压 入 栈 


Jada 直 所 机 开发 


RS | 权衡 优化 、 高 效 和 安全 的 最 优 方案 
将 两 个 字 长 的 局 部 变量 压 入 栈 的 操作 说 明 如 表 7-8 所 示 。 
表 7-8 将 两 个 字 长 的 局 部 变量 压 入 栈 的 操作 说 明 


操作 码 操作 数 说 明 
lload vindex 将 位 置 为 vindex 和 (vindex+1) 的 long 类 型 的 局 部 变量 压 入 栈 
lload 0 (无 ) 将 位 置 为 0 和 1 的 long 类 型 的 局 部 变量 压 入 栈 
lload 1 (无 ) 将 位 置 为 1 和 2 的 long 类 型 的 局 部 变量 压 入 栈 
lload 2 (无 ) 将 位 置 为 2 和 3 的 long 类 型 的 局 部 变量 压 入 栈 
lload 3 (无 ) 将 位 置 为 3 和 4 的 long 类 型 的 局 部 变量 压 入 栈 
dload Vindex 将 位 置 为 vindex 和 (vindex+1) 的 double 类 型 的 局 部 变量 压 入 栈 
dload 0 (无 ) 将 位 置 为 0 和 1 的 double 类 型 的 局 部 变量 压 入 栈 
dload 1 (无 ) 将 位 置 为 1 和 2 的 double 类 型 的 局 部 变量 压 入 栈 
dload 2 (无 ) 将 位 置 为 2 和 3 的 double 类 型 的 局 部 变量 压 入 栈 
dload 3 (无 ) 将 位 置 为 3 和 4 的 double 类 型 的 局 部 变量 压 入 栈 


将 对 象 引用 局 部 变量 压 入 栈 的 操作 说 明 如 表 7-9 所 示 。 
表 7-9 将 对 象 引用 局 部 变量 压 入 栈 的 操作 说 明 
操作 码 说 明 
oad 位 置 为 vindex 的 对 象 引用 局 部 变量 压 入 栈 
soad 0 位 置 为 0 的 对 象 引用 局 部 变量 压 入 栈 
oad 1 位 置 为 1 的 对 象 引用 局 部 变量 压 入 栈 
aload 2 位 置 为 2 的 对 象 引用 局 部 变量 压 入 栈 
ond.3 将 位 置 为 3 的 对 象 引用 局 部 变量 压 入 栈 
弹出 栈 顶 元 素 ， 将 其 赋 给 局 部 变量 的 操作 说 明 如 表 7-10 所 示 。 


表 7-10 ”赋值 给 局 部 变量 的 操作 说 明 


EE 


操作 码 说 明 


从 栈 中 弹出 int 类 型 值 ， 然 后 将 其 存 到 位 置 为 vindex 的 局 部 变量 中 


istore 


从 栈 中 弹出 int 类 型 值 ， 然 后 将 其 存 到 位 置 为 0 的 局 部 变量 中 


istore 0 


从 栈 中 弹出 int 类 型 值 ， 然 后 将 其 存 到 位 置 为 1 的 局 部 变量 中 
从 栈 中 弹出 int 类 型 值 ， 然 后 将 其 存 到 位 置 为 2 的 局 部 变量 中 


istore 1 


istore 2 


从 栈 中 弹出 int 类 型 值 ， 然 后 将 其 存 到 位 置 为 3 的 局 部 变量 中 


istore 3 


fstore 从 栈 中 弹出 float 类 型 值 ， 然 后 将 其 存 到 位 置 为 vindex 的 局 部 变量 中 


fstore 0 从 本 中 弹出 float 类 型 值 ， 然 后 将 其 存 到 位 置 为 0 的 局 部 变量 中 
fotore: 1 从 栈 中 弹出 float 类 型 值 ， 然 后 将 其 存 到 位 置 为 1 的 局 部 变量 中 
fstore 2 (无 ) | 从 我 中 弹出 Hoat 类 型 值 ， 然 后 将 其 存 到 位 置 为 2 的 局 部 变量 中 
fstore 3 从 栈 中 弹出 float 类 型 值 ， 然 后 将 其 存 到 位 置 为 3 的 局 部 变量 中 
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弹出 对 象 引 用 ， 并 将 其 赋值 给 局 部 变量 的 操作 说 明 如 表 7-11 所 示 。 


表 7-11 赋值 给 局 部 变量 的 操作 说 明 


操作 码 操作 数 说 明 

二 从 栈 中 弹出 long 类 型 值 ， 然 后 将 其 存 到 位 置 为 vindex 和 (vindex+1) 的 
局 部 变量 中 

lstore 0 (无 ) 从 栈 中 弹出 long 类 型 值 ， 然 后 将 其 存 到 位 置 为 0 和 1 的 局 部 变量 中 

lstore 1 (无 ) 从 栈 中 弹出 long 类 型 值 ， 然 后 将 其 存 到 位 置 为 1 和 2 的 局 部 变量 中 

lstore 2 (无 ) 从 栈 中 弹出 long 类 型 值 ， 然 后 将 其 存 到 位 置 为 2 和 3 的 局 部 变量 中 

lstore 3 (无 ) 从 栈 中 弹出 long 类 型 值 ， 然 后 将 其 存 到 位 置 为 3 和 4 的 局 部 变量 中 

dk i 从 栈 中 弹出 double 类 型 值 ， 然 后 将 其 存 到 位 置 为 vindex 和 (vindex+1) 
的 局 部 变量 中 

dstore 0 (无 ) 从 栈 中 弹出 double 类 型 值 ， 然 后 将 其 存 到 位 置 为 0 和 1 的 局 部 变量 中 

dstore 1 (无 ) 从 栈 中 弹出 double 类 型 值 ， 然 后 将 其 存 到 位 置 为 1 和 2 的 局 部 变量 中 

dstore 2 (无 ) 从 栈 中 弹出 double 类 型 值 ， 然 后 将 其 存 到 位 置 为 2 和 3 的 局 部 变量 中 

dstore 3 (无 ) 从 栈 中 弹出 double 类 型 值 ， 然 后 将 其 存 到 位 置 为 3 和 4 的 局 部 变量 中 

astore Vindex 从 栈 中 弹出 对 象 引 用 ， 然 后 将 其 存 到 位 置 为 vindex 的 局 部 变量 中 

astore 0 (无 ) 从 栈 中 弹出 对 象 引 用 ， 然 后 将 其 存 到 位 置 为 0 的 局 部 变量 中 

astore 1 (无 ) 从 栈 中 弹出 对 象 引 用 ， 然 后 将 其 存 到 位 置 为 1 的 局 部 变量 中 

astore 2 (无 ) 从 栈 中 弹出 对 象 引用 ， 然 后 将 其 存 到 位 置 为 2 的 局 部 变量 中 

astore 3 (无 ) 从 栈 中 弹出 对 象 引 用 ， 然 后 将 其 存 到 位 置 为 3 的 局 部 变量 中 

astore Vindex 从 栈 中 弹出 对 象 引用 ， 然 后 将 其 存 到 位 置 为 vindex 的 局 部 变量 中 


另外 ， 通 过 无 符号 8 位 局 部 变量 索引 ， 可 以 把 方法 中 局 部 变量 的 数量 限制 在 256 以 
下 。 一 条 单独 的 wide 指令 可 以 将 8 位 的 索引 再 扩展 8 位 ， 这 样 就 可 以 把 局 部 变量 数 的 限 
制 扩展 到 65536， 如 表 7-12 所 示 。 


表 7-12 ”赋值 给 局 部 变量 的 操作 说 明 


操作 码 操作 数 说 明 
wide iload,index, 从 局 部 变量 位 置 为 index 的 地 方 取出 int 类 型 值 ， 并 将 其 压 入 栈 
wide lload ,index 从 局 部 变量 位 置 为 index 的 地 方 取出 long 类 型 值 ， 并 将 其 压 入 栈 
wide fload,index 从 局 部 变量 位 置 为 index 的 地 方 取出 float 类 型 值 ， 并 将 其 压 入 栈 
wide dload,index 从 局 部 变量 位 置 为 index 的 地 方 取出 double 类 型 值 ， 并 将 其 压 入 栈 
wide aload,index 从 局 部 变量 位 置 为 index 的 地 方 取 出 对 象 引 用 ， 并 将 其 压 入 栈 
wide istore,index 从 栈 中 弹出 int 类 型 值 ， 将 其 存 入 位 置 为 index 的 局 部 变量 中 
wide lstore,index 从 栈 中 弹出 long 类 型 值 ， 将 其 存 入 位 置 为 index 的 局 部 变量 中 
wide fstore,index 从 栈 中 弹出 float 类 型 值 ， 将 其 存 入 位 置 为 index 的 局 部 变量 中 
wide dstore,index 从 栈 中 弹出 double 类 型 值 ， 将 其 存 入 位 置 为 index 的 局 部 变量 中 
wide astore,index 从 栈 中 弹出 对 象 引 用 ， 将 其 存 入 位 置 为 index 的 局 部 变量 中 


跳 转 指令 并 不 允许 直接 跳 转 到 被 wide 指令 修改 过 的 操作 码 。 


时 
如 
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对 于 C 和 C++ 的 开发 人 员 来 说 ， 在 内 存 管理 领域 应 该 能 够 游 妨 有 余 。 在 计 
算 机 系统 中 ， 内 存 负 责 维护 每 一 个 对 象 生命 的 开始 到 终结 。 本 章 将 详细 讲解 
Java 虚拟 机 对 内 存 进行 管理 的 基本 知识 ， 介 绍 Jova 虚拟 机 内 存 的 各 个 区 域 ， 
讲解 这 些 区 域 的 作用 、 服 务 对 象 以 及 其 中 可 能 产生 的 问题 ， 为 虚拟 机 内 存 管理 
知识 的 学 习 打下 基础 。 


odor, 


AS 权衡 优化 、 高 效 和 安全 的 最 优 方案 


8.1 Java 的 内 存 分 配 管 理 


Java 内 存 分 配 与 管理 是 Java 的 核心 技术 之 一 ， 一 般 Java 在 内 存 分 配 时 会 涉及 以 下 
域 。 


区 


寄存 器 : 我 们 在 程序 中 无 法 控制 。 

栈 : 存放 基本 类 型 的 数据 和 对 象 的 引用 ， 但 对 象 本 身 不 存放 在 栈 中 ， 而 存放 在 
堆 中 。 

堆 : 存放 用 new 产生 的 数据 。 

静态 域 : 存放 在 对 象 中 用 static 定义 的 静态 成 员 。 

常量 池 : 存放 常量 。 

非 RAM 存储 : 硬盘 等 永久 存储 空间 。 


8.1.1 内 存 分 配 中 的 栈 和 堆 


Oo 


OOOO 


在 函数 中 定义 的 一 些 基本 类 型 的 变量 数据 ， 还 有 对 象 的 引用 变量 都 在 函数 的 栈 内 存 中 
分 配 。 当 在 一 段 代 码 块 中 定义 一 个 变量 时 ，Java 就 在 栈 中 为 这 个 变量 分 配 内 存 空间 ， 当 该 
变量 退出 该 作用 域 后 ，Java 会 自动 释放 掉 为 该 变量 所 分 配 的 内 存 空间 ， 该 内 存 空间 可 以 立 
即 被 另 作 他 用 。 

栈 也 叫 栈 内 存 ， 是 Java 程序 的 运行 区 ， 是 在 线程 创建 时 创建 ， 它 的 生命 期 是 跟随 线程 
的 生命 期 ， 线 程 结束 栈 内 存 也 就 释放 ， 对 于 栈 来 说 不 存在 垃圾 回收 问题 ， 只 要 线程 一 结 
束 ， 该 栈 就 Over。 问 题 出 来 了 : 栈 中 存 的 是 那些 数据 呢 ? 又 什么 是 格式 呢 ? 

栈 中 的 数据 都 是 以 栈 帧 (Stack Frame) 的 格式 存在 ， 栈 帧 是 一 个 内 存 区 块 ， 是 一 个 数据 
集 ， 是 一 个 有 关 方 法 (Method) 和 运行 期 数据 的 数据 集 ， 当 一 个 方法 A 被 调用 时 就 产生 了 一 
个 栈 帧 F1， 并 被 压 入 到 栈 中 ，A 方法 又 调用 了 B 方法 ， 于 是 产生 栈 帧 F2 也 被 压 入 栈 ， 执 
行 完毕 后 ， 先 弹出 F2 栈 帧 ， 再 弹出 Fl 栈 帧 ， 遵 循 “ 先 进 后 出 ”原则 。 

那 栈 帧 中 到 底 存 在 着 什么 数据 呢 ? 在 栈 帧 中 主要 保存 如 下 三 类 数据 : 

口 ”本 地 变量 (Local Variables): 包括 输入 参数 和 输出 参数 以 及 方法 内 的 变量 ; 

口 “ 栈 操作 (Operand Stack): 记录 出 栈 、 入 栈 的 操作 ; 

口 ” 栈 帧 数据 (Frame Data): 包括 类 文件 、 方 法 等 。 

光 说 比较 枯燥 ， 我 们 画 个 图 来 理解 一 下 Java 栈 ， 如 图 8-1 所 示 。 

在 图 8-1 中 ， 在 一 个 栈 中 有 两 个 栈 帧 ， 栈 帧 2 是 最 先 被 调用 的 方法 ， 先 入 栈 ， 然 后 方 
法 2 又 调用 了 方法 1， 栈 帧 1 处 于 栈 顶 的 位 置 ， 栈 帧 2 处 于 栈 底 ， 执 行 完毕 后 ， 依 次 弹出 
栈 帧 1 和 栈 帧 2， 线 程 结 束 ， 栈 释放 。 


人 
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Java Stack 


方法 索引 ( Method Index) 


输入 输出 参数 ( Parameters) 


本 地 变量 ( Local vars) 


Class File (类 ) Stack Frame1 


父 帧 ( Return Frame) 


子 帧 (Next Frame) 


方法 索引 ( Method Index) 


输入 输出 参数 ( Parameters) 


本 地 变量 ( Local vars) 


Class File (类 ) Stack Frame2 


父 帧 ( Return Frame) 


子 帧 (Next Frame) 


图 8-1 Java 栈 
2. 堆 


堆 内 存 用 来 存放 由 关键 字 new 创建 的 对 象 和 数组 。 在 堆 中 分 配 的 内 存 ， 由 Java 虚拟 
机 的 自动 垃圾 回收 器 来 管理 。 

在 堆 中 产生 了 一 个 数组 或 对 象 后 ， 还 可 以 在 栈 中 定义 一 个 特殊 的 变量 ， 让 栈 中 这 个 变 
量 的 取 值 等 于 数组 或 对 象 在 堆 内 存 中 的 首 地 址 ， 栈 中 的 这 个 变量 就 成 了 数组 或 对 象 的 引用 
变量 。 引 用 变量 就 相当 于 是 为 数组 或 对 象 起 的 一 个 名 称 ， 以 后 就 可 以 在 程序 中 使 用 栈 中 
的 引用 变量 来 访问 堆 中 的 数组 或 对 象 。 引 用 变量 就 相当 于 是 为 数组 或 者 对 象 起 的 一 个 
名 称 。 

引用 变量 是 普通 的 变量 ， 定 义 时 在 栈 中 分 配 ， 引 用 变量 在 程序 运行 到 其 作用 域 之 外 后 
被 释放 。 而 数组 和 对 象 本 身 在 堆 中 分 配 ， 即 使 程序 运行 到 使 用 new 产生 数组 或 者 对 象 的 
语句 所 在 的 代码 块 之 外 ， 数 组 和 对 象 本 身 占据 的 内 存 不 会 被 释放 ， 数 组 和 对 象 在 没有 引用 
变量 指向 它 的 时 候 ， 才 变 为 垃圾 ， 不 能 再 被 使 用 ， 但 仍然 占据 内 存 空 间 不 放 ， 在 随后 的 一 


PP RP EE OE > 
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个 不 确定 的 时 间 被 垃圾 回收 器 收 走 (释放 掉 )。 这 也 是 Java 比较 占 内 存 的 原因 。 
实际 上 ， 栈 中 的 变量 指向 堆 内 存 中 的 变量 ， 这 就 是 Java 中 的 指针 。 


3. 常量 池 (Constant Pool) 


常量 池 指 的 是 在 编译 期 被 确定 ， 并 被 保存 在 已 编译 的 .class 文件 中 的 一 些 数据 。 除 了 
包含 代码 中 所 定义 的 各 种 基本 类 型 (如 int、long 等 ) 和 对 象 型 (如 String 及 数组 ) 的 常量 值 
(Final) 还 包含 一 些 以 文本 形式 出 现 的 符号 引用 ， 比 如 : 

口 ”类 和 接口 的 全 限定 名 。 

口 ”字段 的 名 称 和 描述 符 。 

口 方法 和 名 称 和 描述 符 。 

虚拟 机 必须 为 每 个 被 装载 的 类 型 维护 一 个 常量 池 。 常 量 池 就 是 该 类 型 所 用 到 常量 的 一 
个 有 序 集 和 ， 包 括 直 接 常量 (string、integer 和 floating point 常量 ) 和 对 其 他 类 型 ， 字 段 和 方 
法 的 符号 引用 。 

对 于 String 常量 ， 它 的 值 是 在 常量 池 中 的 。 而 JVM 中 的 常量 池 在 内 存 当 中 是 以 表 的 
形式 存在 的 ， 对 于 String 类 型 ， 有 一 张 固定 长 度 的 CONSTANT String info 表 用 来 存储 文 
字 字 符 串 值 ， 但 是 该 表 只 存储 文字 字符 串 值 ， 并 不 存储 符号 引用 。 在 程序 执行 的 时 候 ， 常 
量 池 会 储存 在 Method Area( 方 法 区 域 ) 中 ， 而 不 是 堆 中 。 

一 个 JVM 实例 只 存在 一 个 堆 内 存 ， 堆 内 存 的 大 小 是 可 以 调节 的 。 类 加 载 器 读 取 了 类 
文件 后 ， 需 要 把 类 、 方 法 、 常 变量 放 到 堆 内 存 中 ， 以 方便 执行 器 执行 ， 堆 内 存 分 为 以 下 三 
部 分 。 

1) Permanent Space 永久 存储 区 

永久 存储 区 是 一 个 常 驻 内 存 区 域 ， 用 于 存放 JDK 自身 所 携带 的 Class Interface 的 元 数 
据 。 也 就 是 说 ， 它 存储 的 是 运行 环境 必需 的 类 信息 ， 被 装载 进 此 区 域 的 数据 是 不 会 被 垃圾 
回收 器 回收 掉 的 ， 关 闭 JVM 才 会 释放 此 区 域 所 占用 的 内 存 。 

2) Young Generation Space 新 生 区 

新 生 区 是 类 的 诞生 、 成 长 、 消 亡 的 区 域 ， 一 个 类 在 这 里 产生 、 应 用 ， 最 后 被 垃圾 回收 
器 收集 ， 结 束 生命 。 新 生 区 又 分 为 两 部 分 : 伊 甸 区 (Eden Space) 和 幸存 者 区 (Survivor 
Space)， 所 有 的 类 都 是 在 伊 甸 区 被 new( 新 建 ) 出 来 的 。 幸 存 区 有 两 个 : 0 区 (Survivor 0 space) 
和 1 区 (Survivor 1 space)。 当 伊甸园 的 空间 用 完 时 ， 程 序 又 需要 创建 对 象 ，JVM 的 垃圾 回 
收 器 将 对 伊甸园 区 进行 垃圾 回收 ， 将 伊甸园 区 中 的 不 再 被 其 他 对 象 所 引用 的 对 象 进 行销 
毁 。 然 后 将 伊甸园 中 的 剩余 对 象 移动 到 幸存 0 区 。 若 幸存 0 区 也 满 了 ， 再 对 该 区 进行 垃圾 
回收 ， 然 后 移动 到 1 区 。 那 如 果 1 区 也 满 了 呢 ? 再 移动 到 养老 区 。 

3) Tenure generation space 养老 区 

养老 区 用 于 保存 从 新 生 区 筛选 出 来 的 Java 对 象 ， 一 般 池 对 象 都 在 这 个 区 域 活跃 。 

上 述 三 个 区 的 示意 图 如 图 8-2 所 示 。 
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永久 存储 区 (Permanent Space) 


8-2” 堆 内 存 的 三 个 区 


注意 : 为 什么 要 把 JVM 堆 和 JVM 栈 区 分 出 来 呢 ?JVM 栈 中 不 是 也 可 以 存储 数据 吗 ? 

(1) 从 软件 设计 的 角度 看 ，JVM 栈 代表 了 处 理 逻 辑 ， 而 JVM 堆 代表 了 数据 。 这 样 分 
开 ， 使 得 处 理 逻 辑 更 为 清晰 。 分 而 治之 的 思想 。 这 种 隔离 、 模 块 化 的 思想 在 软件 设计 的 方 
方面 面 都 有 体现 。 

(2) JVM 堆 与 JVM 栈 的 分 离 ， 使 得 JVM 堆 中 的 内 容 可 以 被 多 个 JVM 栈 共享 (也 可 以 
理解 为 多 个 线程 访问 同一 个 对 象 )。 这 种 共享 的 收益 是 很 多 的 。 一 方面 这 种 共享 提供 了 一 种 
有 效 的 数据 交互 方式 (如 共享 内 存 )， 另 一 方面 ，JVM 堆 中 的 共享 常量 和 缓存 可 以 被 所 有 
JVM 栈 访问 ， 节 省 了 空间 。 

(3) JVM 栈 因为 运行 时 的 需要 ， 比 如 保存 系统 运行 的 上 下 文 ， 需 要 进行 地 址 段 的 划 
分 。 由 于 JVM 栈 只 能 向 上 增长 ， 因 此 就 会 限制 住 JVM 栈 存储 内 容 的 能 力 。 而 JVM 堆 不 
同 ，JVM 堆 中 的 对 象 是 可 以 根据 需要 动态 增长 的 ， 因 此 JVM 栈 和 JVM 堆 的 拆 分 ， 使 得 动 
态 增长 成 为 可 能 ， 相 应 JVM 栈 中 只 需 记 录 JVM 堆 中 的 一 个 地 址 即 可 。 

(4) 面向 对 象 就 是 JVM 堆 和 JVM 栈 的 完美 结合 。 其 实 ， 面 向 对 象 方式 的 程序 与 以 前 
结构 化 的 程序 在 执行 上 没有 任何 区 别 。 但 是 ， 面 向 对 象 的 引入 ， 使 得 对 待 问题 的 思考 方式 
发 生 了 改变 ， 而 更 接近 于 自然 方式 的 思考 。 当 我 们 把 对 象 拆 开 ， 你 会 发 现 ， 对 象 的 属性 其 
实 就 是 数据 ， 存 放 在 JVM 堆 中 ; 而 对 象 的 行为 (方法 )， 就 是 运行 逻辑 ， 放 在 JVM 栈 中 。 
我 们 在 编写 对 象 的 时 候 ， 其 实 即 编写 了 数据 结构 ， 也 编写 的 处 理 数据 的 逻辑 。 不 得 不 承 
认 ， 面 向 对 象 的 设计 ， 确 实 很 美 。 


8.1.2” 堆 和 栈 的 合作 


Java 的 堆 是 一 个 运行 时 数据 区 ， 类 的 对 象 从 中 分 配 空间 。 这 些 对 象 通过 new、 
newarray、anewarray 和 multianewarray 等 指令 建立 ， 它 们 不 需要 程序 代码 来 显 式 地 释放 。 
堆 是 由 垃圾 回收 来 负责 的 ， 堆 的 优势 是 可 以 动态 地 分 配 内 存 大 小 ， 生 存 期 也 不 必 事 先 告 
诉 编 译 器 ， 因 为 它 是 在 运行 时 动态 分 配 内 存 的 ，Java 的 垃圾 收集 器 会 自动 收 走 这 些 不 再 使 
用 的 数据 。 但 缺点 是 ， 由 于 要 在 运行 时 动态 分 配 内 存 ， 存 取 速 度 较 慢 。 

栈 的 优势 是 存 取 速 度 比 堆 要 快 ， 仅 次 于 寄存 器 ， 栈 数据 可 以 共享 。 但 缺点 是 ， 存 在 栈 
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中 的 数据 大 小 与 生存 期 必须 是 确定 的 ， 缺 乏 灵 活性 。 栈 中 主要 存放 一 些 基本 类 型 的 变量 数 
据 (int、short、long、byte、float、double、boolean、chanD 和 对 和 象 句 柄 (引用 )。 

栈 有 一 个 很 重要 的 特殊 性 ， 就 是 存在 栈 中 的 数据 可 以 共享 。 假 设 我 们 同时 定义 : 

ee 

编译 器 先 处 理 int a = 3; 首先 它 会 在 栈 中 创建 一 个 变量 为 a 的 引用 ， 然 后 查找 栈 中 是 
否 有 3 这 个 值 ， 如 果 没 找到 ， 就 将 3 存放 进来 ， 然 后 将 a 指向 3。 接着 处 理 ntb = 3; 在 创 
建 完 b 的 引用 变量 后 ， 因 为 在 栈 中 己 经 有 3 这 个 值 ， 便 将 b 直接 指向 3。 这 样 ， 就 出 现 了 
a 与 b 同时 均 指 向 3 的 情况 。 如 果 这 时 再 令 a=4; 那么 编译 器 会 重新 搜索 栈 中 是 否 有 4 
值 ， 如 果 没 有 ， 则 将 4 存放 进来 ， 并 令 a 指向 4; 如 果 已 经 有 了 ， 则 直接 将 a 指向 这 个 地 
址 。 因 此 a 值 的 改变 不 会 影响 到 的 值 。 

要 注意 这 种 数据 的 共享 与 两 个 对 象 的 引用 同时 指向 一 个 对 象 的 这 种 共享 是 不 同 的 ， 因 
为 这 种 情况 a 的 修改 并 不 会 影响 到 b， 它 是 由 编译 器 完成 的 ， 有 利于 节省 空间 。 而 一 个 对 
象 引 用 变量 修改 了 这 个 对 象 的 内 部 状态 ， 会 影响 到 另 一 个 对 象 引用 变量 。 

在 Java 中 ，String 是 一 个 特殊 的 包装 类 数据 。 可 以 用 如 下 两 种 的 形式 来 创建 。 

String str = new String("abc"); 
String str = "abc"; 

其 中 第 一 种 是 用 new(0 来 新 建 对 象 的 ， 它 会 在 存放 于 堆 中 。 每 调用 一 次 就 会 创建 一 个 
新 的 对 象 。 而 第 二 种 是 先 在 栈 中 创建 一 个 对 String 类 的 对 象 引用 变量 str， 然 后 通过 符号 引 
用 去 字符 串 常量 池 里 找 有 没有 "abc"， 如 果 没 有 ， 则 将 "abc" 存 放 进 字符 串 常量 池 ， 并 令 
str 指向 "abc"， 如 果 已 经 有 "abc" 则 直接 令 str 指向 "abc"。 

比较 类 里 面 的 数值 是 否 相等 时 使 用 equals0 方 法 ， 当 测试 两 个 包装 类 的 引用 是 否 指向 
同一 个 对 象 时 ， 用 = =， 下 面 用 例子 说 明 上 面 的 理论 。 

String strl = "abc"; 


String str2 = "abc"; 
System.out .println(strl==str2); //true 


由 此 可 以 看 出 strl 和 str2 是 指向 同一 个 对 象 的 。 


String strl =new String ("abc"); 
String str2 =new String ("abc"); 
System.out .Println (strl==str2); // false 
用 new 的 方式 的 功能 是 生成 不 同 的 对 象 ， 每 一 次 生成 一 个 。 因 此 用 第 二 种 方式 创建 多 
个 "abc" 字 符 串 ， 在 内 存 中 其 实 只 存在 一 个 对 象 而 已 。 这 种 写法 有 利于 节省 内 存 空间 ， 同 时 
它 可 以 在 一 定 程度 上 提高 程序 的 运行 速度 ， 因 为 JVM 会 自动 根据 栈 中 数据 的 实际 情况 来 
决定 是 否 有 必要 创建 新 对 象 。 而 对 于 代码 “String str = new String("abc"):”， 则 一 概 在 堆 中 
创建 新 对 象 ， 而 不 管 其 字符 串 值 是 否 相等 ， 是 否 有 必要 创建 新 对 象 ， 从 而 加 重 了 程序 的 
负担 。 
另 一 方面 ， 要 注意 在 使 用 诸如 “String str = "abc":” 的 格式 定义 类 时 ， 总 是 想当然 地 认 
为 ， 创 建 了 String 类 的 对 象 sr。 此 时 会 担心 对 象 可 能 并 没有 被 创建 ， 而 可 能 只 是 指向 一 个 
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先前 已 经 创建 的 对 象 。 只 有 通过 方法 new0 才 能 保证 每 次 都 创建 一 个 新 的 对 象 。 

由 于 String 类 的 immutable 性 质 ， 当 String 变量 需要 经 常 变 换 其 值 时 ， 应 该 考虑 使 用 
StringBuffer 类 以 提高 程序 效率 。 因 为 String 不 属于 8 种 基本 数据 类 型 ，String 是 一 个 对 
象 。 所 以 对 象 的 默认 值 是 null， 所 以 String 的 默认 值 也 是 null; 但 它 又 是 一 种 特殊 的 对 
象 ， 有 其 他 对 象 没有 的 一 些 特性 。 由 此 可 见 ，new String0 和 new String("") 都 是 申明 一 个 新 
的 空 字符 串 ， 是 空 串 不 是 null。 

请 看 下 面 的 代码 : 

String s0="kvill"; 

String sl="kvill"; 

StEring s2="y® 4 iLLY 

System.out.println( s0==s1 ); 

System.out.println( s0==s2 ); 

运行 结果 为 : 

true true 

Java 会 确保 一 个 字符 串 常量 只 有 一 个 拷贝 。 因 为 上 述 例子 中 的 s0 和 sl 中 的 "kvill" 都 
是 字符 串 常 量 ， 它 们 在 编译 期 就 被 确定 了 ， 所 以 s0 一 sl 为 true; 而 "kv" 和 "ill" 也 都 是 字符 
串 常量 ， 当 一 个 字符 串 由 多 个 字符 串 常 量 连接 而 成 时 ， 它 自己 肯定 也 是 字符 串 常量 ， 所 以 
s2 也 同样 在 编译 期 就 被 解析 为 一 个 字符 串 常量 ， 所 以 s2 也 是 常量 池 中 "kvill" 的 一 个 引用 。 
所 以 我 们 得 出 s0 一 s1 一 s2; 用 new String() 创建 的 字符 串 不 是 常量 ， 不 能 在 编译 期 就 确 
定 ， 所 以 new String() 创建 的 字符 串 不 放 入 常量 池 中 ， 它 们 有 自己 的 地 址 空间 。 

再 看 下 面 的 代码 : 

String s0="kvill"; 

String sl=new String ("kvill"); 

String s2="kv" + new String("ill"); 

System.out.println( s0==s1 ); 

System.out.println( s0==s2 ); 

System.out.println( sl==s2 ); 

运行 结果 为 : 

false false false 

在 上 述 代码 中 ，s0 还 是 常量 池 中 "kvill" 的 应 用 ，s1 因为 无 法 在 编译 期 确定 ， 所 以 是 运 
行 时 创建 的 新 对 象 "kvill" 的 引用 ，s2 因为 有 后 半 部 分 new String("ill") 所 以 也 无 法 在 编译 期 
确定 ， 所 以 也 是 一 个 新 创建 对 象 "kvill" 的 应 用 ， 明 白 了 这 些 也 就 知道 为 何 得 出 此 结果 了 。 

另外 ， 存 在 于 .class 文件 中 的 常量 池 ， 在 运行 时 被 JVM 装载 ， 并 且 可 以 扩充 。String 
的 intern() 方 法 就 是 扩充 常量 池 的 一 个 方法 ， 当 一 个 String 实例 str 调用 interm0 方 法 时 ， 
Java 查找 常量 池 中 是 否 有 相同 Unicode 的 字符 串 常量 ， 如 果 有 则 返回 其 的 引用 ， 如 果 没 有 
则 在 常量 池 中 增加 一 个 Unicode 等 于 str 的 字符 串 并 返回 它 的 引用 。 请 看 下 面 的 演示 示例 : 

String 30= “Eville 

String sl=new String("kvill"); 


String s2=new String ("kvill"); 
System.out.println( s0==s1 ); 


PT TO OO Ba 211 


KE 


SySstem.out .println( mk 友 却 克 故 夺 帮办 寺 交 罗 )7 
sl.intern(); 

52=52.intern(); // 把 常量 池 中 "kvil1" 的 引用 赋 给 s2 
System.out.println( s0==s1); 
System.out.println( s0==s1.intern() ); 
System.out.println( s0==s2 ); 


运行 结果 为 : 

false false // 虽 然 执 行 了 sl.intern() ,但 它 的 返回 值 没有 赋 给 s1 

true // 说 明 sl.intern() 返 回 的 是 常量 池 中 "kvi1l1" 的 引用 true 

另外 ， 很 多 人 认为 使 用 String.intern0) 方 法 可 以 将 一 个 String 类 的 保存 到 一 个 全 局 
String 表 中 ， 如 果 具 有 相同 值 的 Unicode 字符 串 已 经 在 这 个 表 中 ， 那 么 该 方法 返回 表 中 已 
有 字符 串 的 地 址 ， 如 果 在 表 中 没有 相同 值 的 字符 串 ， 则 将 自己 的 地 址 注册 到 表 中 “如 果 我 
把 他 说 的 这 个 全 局 的 String 表 理 解 为 常量 池 的 话 ， 如 果 在 表 中 没有 相同 值 的 字符 串 ， 则 
将 自己 的 地 址 注册 到 表 中 ”是 错 的 。 请 看 下 面 的 演示 示例 : 


String sl=new String("kvill")7 

String s2=sl.intern(); 

System.out .println( sl==sl.intern() ); 
System.out .println( sl+" "+s2 ); 
System.out.println( s2==sl.intern() ); 


运行 结果 为 : 

false Kkvill kvill true 

在 这 个 类 中 我 们 没有 声名 一 个 "kvill" 常 量 ， 所 以 常量 池 中 一 开始 是 没有 "kvill" 的 ， 当 我 
们 调用 sl.intern0 后 就 在 常量 池 中 新 添加 了 一 个 "kvill" 常 量 ， 原 来 的 不 在 常量 池 中 的 "kvill" 
仍然 存在 ， 也 就 不 是 “将 自己 的 地 址 注册 到 常量 池 中 ”了 。 

sl= =sl.intern() 为 false 说 明 原 来 的 "kvill" 仍 然 存 在 ; s2 现在 为 常量 池 中 "kvill" 的 地 址 ， 
所 以 有 s2= =sl.inter() 为 true。 

通过 使 用 equals()，String 可 以 比较 两 字符 串 的 Unicode 序列 是 否 相 当 ， 如 果 相 等 返回 
true。 而 “==” 是 比较 两 字符 串 的 地 址 是 否 相 同 ， 也 就 是 是 否 是 同一 个 字符 串 的 引用 。 

String 的 实例 一 旦 生成 就 不 会 再 改变 了 ， 比 如 : 


String str="kv"+"ill"+" "+"ans"; 


上 述 st 有 4 个 字符 串 常量 ， 首 先 "ky" 和 "il1" 生 成 了 "kvill" 存 在 内 存 中 ， 然 后 "kvill" 又 和 
"" 生成 "kvill" 存 在 内 存 中 ， 最 后 又 和 生成 了 "kvill ans"。 并 把 这 个 字符 串 的 地 址 赋 给 了 
str， 就 是 因为 String 的 “不 可 变 ” 产 生 了 很 多 临时 变量 ， 这 也 就 是 为 什么 建议 用 
StringBuffer 的 原因 了 ， 因 为 StringBuffer 是 可 改变 的 。 

Java 内 存 分 配 与 管理 是 Java 的 核心 技术 之 一 ， 之 前 我 们 曾 介 绍 过 Java 的 内 存 管理 与 
内 存 泄露 以 及 Java 垃圾 回收 方面 的 知识 ， 今 天 我 们 再 次 深入 Java 核心 ， 详 细 介 绍 一 下 
Java 在 内 存 分 配方 面 的 知识 。 
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8.2 运行 时 的 数据 区 域 


Java 通过 自身 的 动态 内 存 分 配 和 垃圾 回收 机 制 ， 可 以 使 Java 程序 员 不 用 像 C++ 程序 员 
那么 头疼 内 存 的 分 配 与 回收 。 对 于 这 一 点 来 说 ， 相 信 熟 悉 COM 机 制 的 朋友 对 于 引用 计数 
管理 内 存 的 方式 深 有 感触 。 通 过 Java 虚拟 机 的 自动 内 存 管理 机 制 ， 不 仅 降低 了 编码 的 难 
度 ， 而 且 不 容易 出 现 内 存 泄 露 和 内 存 溢出 的 问题 。 但 是 这 过 于 理想 的 愿望 正 是 由 于 把 内 存 
的 控制 权 交 给 了 Java 虚拟 机 ， 一 旦 出 现 内 存 泄露 和 溢出 ， 我 们 就 必须 翻 过 Java 虚拟 机 自 
动 内 存 管 理 这 堵 高 墙 去 排查 错误 。 所 以 本 节 将 详细 讲解 JVM 运行 时 数据 区 域 的 划分 、 作 
用 以 及 可 能 出 现 的 异常 。 

根据 《Java 虚拟 机 规范 》 的 规定 ，Java 虚拟 机 在 执行 Java 程序 时 ， 即 运行 时 环境 下 会 
把 其 所 管理 的 内 存 划 分 为 几 个 不 同 的 数据 区 域 。 有 的 区 域 伴随 虚拟 机 进程 的 启动 而 创建 ， 
死亡 而 销毁 ;有些 区 域 则 是 依赖 用 户 线程 的 启动 时 创建 ， 结 束 时 销毁 。 所 有 线程 共享 方法 
区 和 堆 ， 虚 拟 机 栈 、 本 地 方法 栈 和 程序 计数 器 是 线程 隔离 的 数据 区 。Java 虚拟 机 运行 时 的 
数据 区 结构 如 图 8-3 所 示 。 


运行 时 数据 
方法 区 虚拟 机 栈 || 本 地 方法 校 
堆 程序 计数 器 


8-3 Java 虚拟 机 运行 时 的 数据 区 结构 


Java 虚拟 机 内 存 模型 中 定义 的 访问 操作 与 物理 计算 机 处 理 的 基本 一 致 。Java 通过 多 线 
程 机 制 使 得 多 个 任务 同时 执行 处 理 ， 所 有 的 线程 共享 JVM 内 存 区 域 Main Memory， 而 每 
个 线程 又 单独 的 有 自己 的 工作 内 存 ， 当 线程 与 内 存 区 域 进行 交互 时 ， 数 据 从 主 存 拷贝 到 工 
作 内 存 ， 进 而 交 由 线程 处 理 (操作 码 + 操作 数 )。 


8.2.1 程序 计数 器 (Program Counter Register) 


程序 计数 器 是 一 块 较 小 的 内 存 空 间 ， 其 作用 相当 于 当前 线程 所 执行 的 字 节 码 的 行 号 指 
示 器 。 在 虚拟 机 的 概念 模型 里 ， 字 节 码 解释 器 工作 时 通过 改变 这 个 计数 器 的 值 来 选取 下 一 
条 需要 执行 的 字 节 码 指 令 ， 分 支 、 循 环 、 跳 转 、 异 常 处 理 、 线 程 恢复 等 基础 功能 都 需要 依 
赖 这 个 计数 器 来 完成 。 

由 于 Java 虚拟 机 的 多 线程 是 通过 线程 轮流 切换 并 分 配 处 理 器 执行 时 间 的 方式 来 实现 
的 ， 在 任何 一 个 确定 的 时 刻 ， 一 个 处 理 器 (对 于 多 核 处 理 器 来 说 是 一 个 内 核 ) 只 会 执行 一 条 
线程 中 的 指令 。 因 此 为 了 线程 切换 后 能 恢复 到 正确 的 执行 位 置 ， 每 条 线程 都 需要 有 一 个 独 
立 的 程序 计数 器 ， 各 条 线程 之 间 的 计数 器 互 不 影响 ， 独 立 存 储 ， 我 们 称 这 类 内 存 区 域 为 
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“线程 私有 ”的 内 存 。 

如 果 线 程 正在 执行 的 是 一 个 Java 方法 ， 这 个 计数 器 记录 的 是 正在 执行 的 虚拟 机 字 节 码 
指令 的 地 址 。 如 果 正 在 执行 的 是 Native 方法 ， 这 个 计数 器 值 则 为 空 (Undefined)。 此 内 存 区 
域 是 唯一 一 个 在 Java 虚拟 机 规范 中 没有 规定 任何 OutOfMemoryError 情况 的 区 域 。 

因为 操作 系统 通过 时 间 片 轮流 的 多 线程 并 发 方式 ， 任 何 时 刻 处 理 器 只 会 处 理 当 前 线程 
的 指令 。 线 程 间 切 换 的 并 发 要 求 每 个 线程 都 需要 有 一 个 私有 的 程序 计数 器 ， 程 序 计 数 器 间 
互 不 影响 。 

程序 计数 器 存储 当前 线程 下 一 条 要 执行 的 字 节 码 的 地 址 ， 占 用 内 存 空 间 较 小 。 所 有 的 
控制 执行 流程 ， 分 支 、 循 环 、 返 回 、 异 常 等 功能 都 在 程序 计数 器 的 指示 范围 之 内 ， 字 节 码 
解释 器 通过 改变 程序 计数 器 的 值 来 获取 下 一 条 要 执行 的 字 节 码 的 指令 。 


8.2.2 ”Java 的 虚拟 机 栈 VM Stack 


虚拟 机 栈 是 类 中 的 方法 的 执行 过 程 的 内 存 模型 。 与 程序 计数 器 一 样 ，Java 虚拟 机 栈 
(Java Virtual Machine Stacks) 也 是 线程 私有 的 ， 它 的 生命 周期 与 线程 相同 。 虚 拟 机 栈 描述 的 
是 Java 方法 执行 的 内 存 模型 : 每 个 方法 被 执行 的 时 候 都 会 同时 创建 一 个 栈 帧 (Stack Frame) 
用 于 存储 局 部 变量 表 、 操 作 数 栈 、 动 态 链接 、 方 法 出 口 等 信息 。 每 一 个 方法 被 调用 直至 执 
行 完成 的 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 栈 中 从 入 栈 到 出 栈 的 过 程 。 
对 于 方法 调用 来 说 ， 很 有 必要 了 解 下 栈 帧 的 概念 。 
虚拟 机 在 执行 每 个 方法 的 调用 时 会 创建 一 个 栈 帧 的 数据 结构 ， 它 是 虚拟 机 运行 时 数据 
区 中 的 虚拟 机 栈 的 栈 元 素 。 每 个 方法 的 调用 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 里 的 入 栈 出 
栈 的 过 程 。 栈 帧 包括 了 方法 的 局 部 变量 表 、 操 作 数 栈 、 动 态 链接 和 方法 出 口 等 一 些 额外 的 
附加 信息 。 对 于 活动 线程 中 栈 顶 的 帧 栈 ， 称 为 当前 栈 帧 ， 这 个 栈 帧 所 关联 的 方法 称 为 当前 
方法 ， 正 在 执行 的 字 节 码 指令 都 只 针对 当前 有 效 栈 帧 进行 操作 。 
在 栈 帧 的 基础 上 ， 不 难 理解 虚拟 机 栈 的 内 存 结构 。Java 虚拟 机 规范 规定 虚拟 机 栈 的 大 
小 是 可 以 固定 的 或 者 动态 分 配 大 小 。Java 虚拟 机 实现 可 以 向 程序 员 提 供 对 Java 栈 的 初始 大 
小 的 控制 ， 以 及 在 动态 扩展 或 者 收缩 Java 栈 的 情况 下 ， 控 制 Java 栈 的 最 大 值 和 最 小 值 。 
下 面 列 出 的 异常 情况 与 Java 栈 相关 。 
口 如 果 线 程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 深度 ， 则 Java 虚拟 机 将 抛 出 
StackOverflowError 异常 。 

口 “ 如 果 虚 拟 机 栈 可 以 动态 扩展 ， 但 是 无 法 申请 到 足够 的 内 存 来 实现 扩展 ， 或 者 不 能 
得 到 足够 的 内 存 为 一 个 新 线程 创建 初始 Java 栈 ， 则 Java 虚拟 机 将 抛 出 
OutOfMemoryError 异常 。 

有 人 通常 把 Java 内 存 区 分 为 堆 内 存 (Heap) 和 栈 内 存 (Stack)， 其 实 Java 内 存 区 域 的 划分 
实际 上 远 比 这 复杂 。 这 种 划分 方式 的 流行 只 能 说 明 大 多 数 程序 员 最 关注 的 、 与 对 象 内 存 分 
配 关系 最 密切 的 内 存 区 域 是 这 两 块 。 其 中 所 指 的 “ 栈 ” 就 是 现在 讲 的 虚拟 机 栈 ， 或 者 说 是 
虚拟 机 栈 中 的 局 部 变量 表 部 分 。 

在 局 部 变量 表 中 存放 了 编译 期 可 知 的 各 种 基本 数据 类 型 (boolean、byte、char、short、 
mt、float、long、double)、 对 象 引用 (reference 类 型 ， 它 不 等 同 于 对 象 本 身 ， 根 据 不 同 的 虚 
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拟 机 实现 ， 它 可 能 是 一 个 指向 对 象 起 始 地 址 的 引用 指针 ， 也 可 能 指向 一 个 代表 对 象 的 句柄 
或 者 其 他 与 此 对 象 相关 的 位 置 ) 和 retumAddress 类 型 (指向 了 一 条 字 节 码 指令 的 地 址 )。 

其 中 64 位 长 度 的 long 和 double 类 型 的 数据 会 占用 两 个 局 部 变量 空间 (Slot)， 其 余 的 数 
据 类 型 只 占用 一 个 。 局 部 变量 表 所 需 的 内 存 空间 在 编译 期 间 完 成 分 配 ， 当 进入 一 个 方法 
时 ， 这 个 方法 需要 在 帧 中 分 配 多 大 的 局 部 变量 空间 是 完全 确定 的 ， 在 方法 运行 期 间 不 会 改 
变局 部 变量 表 的 大 小 。 

在 Java 虚拟 机 规范 中 ， 对 这 个 区 域 规定 了 两 种 异常 状况 : 如 果 线 程 请 求 的 栈 深 度 大 于 
虚拟 机 所 允许 的 深度 ， 将 抛 出 StackOverflowError 异常 ， 如 果 虚 拟 机 栈 可 以 动态 扩展 (当前 
大 部 分 的 Java 虚拟 机 都 可 动态 扩展 ， 只 不 过 Java 虚拟 机 规范 中 也 允许 固定 长 度 的 虚拟 机 
栈 )， 当 扩展 时 无 法 申请 到 足够 的 内 存 时 会 抛 出 OutOfMemoryError 异常 。 


8.2.3 ”本 地 方法 栈 Native Method Stack 


在 本 地 方法 栈 中 执行 的 是 非 Java 语言 编写 的 代码 ， 例 如 C 或 C++。 虚 拟 机 栈 执行 的 
是 Java 方法 字 节 码 服务 ， 这 是 两 者 最 大 的 区 别 。 本 地 方法 栈 的 是 虚拟 机 使 用 本 地 方法 服务 
的 ， 如 果 提 供 本 地 方法 栈 ， 则 它们 通常 在 每 个 线程 被 创建 时 分 配 在 每 个 线程 基础 上 的 。 虚 
拟 机 规范 中 对 本 地 方法 栈 中 的 方法 使 用 的 语言 、 使 用 方式 与 数据 结构 并 没有 强制 规定 ， 因 
此 具体 的 虚拟 机 可 以 自由 实现 它 。 甚 至 有 的 虚拟 机 (譬如 Sun HotSpot 虚拟 机 ) 直接 就 把 本 
地 方法 栈 和 虚拟 机 栈 合 二 为 一 。 

同 虚拟 机 栈 一 样 ， 本 地 方法 栈 也 会 出 现 与 虚拟 机 栈 类 似 的 异常 ， 也 会 抛 出 
StackOverflowError 和 OutOfMemoryError 异常 。 


8.2.4 Java 堆 Java Heap 


Java 堆 是 类 实例 和 数组 的 分 配 空间 ， 是 一 块 所 有 线程 共享 的 内 存 区 域 。 堆 在 虚拟 机 启 
动 时 创建 ， 是 Java 虚拟 机 所 管理 的 内 存 中 最 大 一 块 。 内 存 泄露 和 溢出 的 问题 大 都 出 现在 堆 
区 域 ， 由 此 可 见 ， 对 于 大 多 数 应 用 来 说 ，Java 堆 (Java Heap) 是 Java 虚拟 机 所 管理 的 内 存 中 
最 大 的 一 块 。 

从 内 存 回收 的 角度 看 ， 由 于 现在 收集 器 基本 上 都 是 采用 的 分 代 收 集 算法 ，Java 堆 还 可 
细 分 为 新 生 代 和 老年 代 ; 从 内 存 分 配 的 角度 看 ， 线 程 共 享 的 Java 堆 中 可 能 划分 出 多 个 线程 
私有 的 分 配 缓存 区 。 这 种 进一步 的 内 存 划分 方式 目的 是 更 好 地 回收 内 存 ， 或 者 更 快 地 分 配 
内 存 。 

Java 堆 是 被 所 有 线程 共享 的 一 块 内 存 区 域 ， 在 虚拟 机 启动 时 创建 。 此 内 存 区 域 的 唯一 
目的 就 是 存放 对 象 实例 ， 几 乎 所 有 的 对 象 实例 都 在 这 里 分 配 内 存 。 这 一 点 在 Java 虚拟 机 规 
范 中 的 描述 是 : 所 有 的 对 象 实例 以 及 数组 都 要 在 堆 上 分 配 ， 但 是 随 着 JIT 编译 器 的 发 展 与 
逃逸 分 析 技 术 的 逐渐 成 熟 ， 栈 上 分 配 、 标 量 蔡 换 优化 技术 将 会 导致 一 些微 妙 的 变化 发 生 ， 
所 有 的 对 象 都 分 配 在 堆 上 也 渐渐 变 得 不 是 那么 “肯定 ”了 。 

Java 虚拟 机 规范 规定 堆 在 内 存单 元 中 只 要 在 逻辑 上 是 连续 的 即 可 ，Java 堆 是 可 以 是 固 
定 大 小 的 ， 或 者 按照 需求 做 动态 扩展 ， 并 且 可 以 在 一 个 大 的 堆 变 的 不 必要 时 收缩 。Java 虚 
拟 机 的 实现 向 程序 员 或 者 用 户 提供 了 对 堆 初 始 化 大 小 的 控制 ， 以 及 对 堆 动 态 扩 展 和 收缩 的 
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最 大 值 和 最 小 值 的 控制 。 

下 面 的 异常 情况 与 Java 堆 相 关 : 如 果 堆 中 没有 可 用 内 存 完成 类 实例 或 者 数组 的 分 配 ， 
在 对 象 数量 达到 最 大 堆 的 容量 限制 后 将 抛 出 OutOfMemoryError 异常 。 

Java 堆 是 垃圾 收集 器 管理 的 主要 区 域 ， 因 此 很 多 时 候 也 被 称 做 “GC 堆 ”(Garbage 
Collected Heap)。 如 果 从 内 存 回收 的 角度 看 ， 由 于 现在 收集 器 基本 都 是 采用 的 分 代 收 集 算 
法 ， 所 以 Java 堆 中 还 可 以 继续 细 分 为 : 新 生 代 和 老年 代 。 如 果 再 细致 一 点 ， 可 以 分 为 
Eden 空间 、From Survivor 空间 、To Survivor 空间 等 。 如 果 从 内 存 分 配 的 角度 看 ， 线 程 共 
享 的 Java 堆 中 可 能 划分 出 多 个 线程 私有 的 分 配 缓冲 区 (Thread Local Allocation Buffer， 
TLAB)。 但 是 无 论 如 何 划分 ， 都 与 存放 内 容 无 关 ， 无 论 哪个 区 域 ， 存 储 的 都 仍然 是 对 象 实 
例 。 进 一 步 划 分 的 目的 是 为 了 更 好 地 回收 内 存 ， 或 者 更 快 地 分 配 内 存 。 

根据 Java 虚拟 机 规范 的 规定 ，Java 堆 可 以 处 于 物理 上 不 连续 的 内 存 空 间 中 ， 只 要 逻辑 
上 是 连续 的 即 可 ， 就 像 我 们 的 磁盘 空间 一 样 。 在 实现 时 ， 既 可 以 实现 成 固定 大 小 的 ， 也 可 
以 是 可 扩展 的 ， 不 过 当前 主流 的 虚拟 机 都 是 按照 可 扩展 来 实现 的 (通过 -Xmx 和 -Xms 控 
制 )。 


8.2.5 方法 区 Method Area 


方法 区 在 虚拟 机 启动 时 创建 ， 也 是 一 块 所 有 线程 共享 的 内 存 区 域 。 方 法 区 用 于 存储 已 
被 虚拟 机 加 载 的 类 人 信息、 常量、 静态 变量 、 即 时 编译 器 编译 后 的 代码 等 数据 。 用 一 句 话说 
就 是 方法 区 类 似 于 传统 语言 的 编译 后 代码 的 存储 区 。 

方法 区 与 Java 堆 一 样 ， 是 各 个 线程 共享 的 内 存 区 域 ， 它 用 于 存储 已 被 虚拟 机 加 载 的 类 
信息 、 常 量 、 静 态 变量 、 即 时 编译 器 编译 后 的 代码 等 数据 。 虽 然 Java 虚拟 机 规范 把 方法 区 
描述 为 堆 的 一 个 逻辑 部 分 ， 但 是 它 却 有 一 个 别名 叫做 Non-Heap( 非 堆 )， 目 的 应 该 是 与 Java 
堆 区 分 开 来 。 

对 于 习惯 在 HotSpot 虚拟 机 上 开发 和 部 署 程序 的 开发 者 来 说 ， 很 多 人 愿意 把 方法 区 称 
为 “永久 代 ”(Permanent Generation)， 本 质 上 两 者 并 不 等 价 ， 仅 仅 是 因为 HotSpot 虚拟 机 
的 设计 团队 选择 把 GC 分 代 收 集 扩 展 至 方法 区 ， 或 者 说 使 用 永久 代 来 实现 方法 区 而 已 。 对 
于 其 他 虚拟 机 (如 BEA 栋 ockit、IBM J9 等 ) 来 说 是 不 存在 永久 代 的 概念 的 。 即 使 是 HotSpot 
虚拟 机 本 身 ， 根 据 官方 发 布 的 路 线 图 信息 ， 现 在 也 有 放弃 永久 代 并 “搬家 ”至 Native 
Memory 来 实现 方法 区 的 规划 了 。 

Java 虚拟 机 规范 对 这 个 区 域 的 限制 非常 宽松 ， 除 了 和 Java 堆 一 样 不 需要 连续 的 内 存 和 
可 以 选择 固定 大 小 或 者 可 扩展 外 ， 还 可 以 选择 不 实现 垃圾 收集 。 相 对 而 言 ， 垃 圾 收集 行为 
在 这 个 区 域 是 比较 少 出 现 的 ， 但 并 非 数 据 进 入 了 方法 区 就 如 永久 代 的 名 字 一 样 “ 永 久 ” 存 
在 了 。 这 个 区 域 的 内 存 回 收 目标 主要 是 针对 常量 池 的 回收 和 对 类 型 的 卸载 ， 一 般 来 说 这 个 
区 域 的 回收 “成 绩 ” 比 较 难以 令 人 满意 ， 尤 其 是 类 型 的 卸载 ， 条 件 相当 苛 刻 ， 但 是 这 部 分 
区 域 的 回收 确实 是 有 必要 的 。 在 Sun 公司 的 BUG 列表 中 ， 曾 出 现 过 的 若干 个 严重 的 BUG 
就 是 由 于 低 版 本 的 HotSpot 虚拟 机 对 此 区 域 未 完全 回收 而 导致 内 存 泄露 。 

虽然 Java 虚拟 机 规范 在 逻辑 上 把 方法 区 描述 为 堆 的 一 个 部 分 ， 但 是 在 垃圾 回收 方面 的 
限制 却 比 较 宽松 ， 宽 松 到 方法 区 可 以 不 用 实现 垃圾 回收 。 但 是 ， 垃 圾 回收 在 方法 区 还 是 必 
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须 有 的 ， 只 是 回收 效果 不 是 很 明显 。 这 个 区 域 的 回收 目标 主要 针对 的 是 常量 池 的 回收 和 对 
类 型 的 卸载 。 

方法 区 的 大 小 也 可 以 控制 ， 以 下 异常 与 方法 区 相关 : 

如 果 方 法 区 无 法 满足 内 存 分 配 需 求 时 ， 将 会 抛 出 OutOfMemoryError 异常 。 


8.2.6 ”运行 时 常量 池 Runtime Constant Pool 


运行 时 常量 池 (Runtime Constant Pool) 是 方法 区 的 一 部 分 。 在 Class 文件 中 除了 有 类 的 
版 本 、 字 段 、 方 法 、 接 口 等 描述 等 信息 外 ， 还 有 一 项 信息 是 常量 池 (Constant Pool Table)， 
用 于 存放 编译 期 生成 的 各 种 字面 量 和 符号 引用 ， 这 部 分 内 容 将 在 类 加 载 后 存放 到 方法 区 的 
运行 时 常量 池 中 。 

常量 池 是 每 个 类 的 Class 文件 中 存储 编译 期 生成 的 各 种 字面 量 和 符号 引用 的 运行 期 表 
示 ， 其 数据 结构 是 一 种 由 无 符号 数 和 表 组 长 的 类 似 于 C 语言 结构 体 的 伪 结 构 。 另 外 ， 常 量 
池 也 是 方法 区 的 一 部 分 ， 类 的 常量 池 在 该 类 的 Java class 文件 被 Java 虚拟 机 成 功 地 装载 时 
创建 ， 这 部 分 内 容 在 类 加 载 后 存放 到 方法 区 的 运行 时 常量 池 中 。 

Java 虚拟 机 对 Class 文件 的 每 一 部 分 (自然 也 包括 常量 池 ) 的 格式 都 有 严格 的 规定 ， 每 一 
个 字 节 用 于 存储 哪 种 数据 都 必须 符合 规范 上 的 要 求 ， 这 样 才 会 被 虚拟 机 认可 、 装 载 和 执 
行 。 但 对 于 运行 时 常量 池 来 说 ，Java 虚拟 机 规范 没有 做 任何 细节 的 要 求 ， 不 同 的 提供 商 实 
现 的 虚拟 机 可 以 按照 自己 的 需要 来 实现 这 个 内 存 区 域 。 不 过 ， 一 般 来 说 ， 除 了 保存 Class 
文件 中 描述 的 符号 引用 外 ， 还 会 把 翻译 出 来 的 直接 引用 也 存储 在 运行 时 常量 池 中 。 

运行 时 常量 池 相 对 于 Class 文件 常量 池 的 另外 一 个 重要 特征 是 具备 动态 性 ，Java 语言 
并 不 要 求 常量 一 定 只 能 在 编译 期 产生 ， 也 就 是 并 非 预 置 入 Class 文件 中 常量 池 的 内 容 才能 
进入 方法 区 运行 时 常量 地， 运行 期 间 也 可 能 将 新 的 常量 放 入 池 中 ， 这 种 特性 被 开发 人 员 利 
用 得 比较 多 的 便 是 String 类 的 intermn() 方 法 。 

既然 运行 时 常量 池 是 方法 区 的 一 部 分 ， 自 然 会 受到 方法 区 内 存 的 限制 ， 当 常量 池 无 法 
再 申请 到 内 存 时 会 抛 出 OutOfMemoryError 异常 。 运 行 时 常量 池 属 于 方法 区 ， 自 然 也 受到 
方法 区 内 存 大 小 的 限制 ， 以 下 异常 与 常量 池 有 关 : 

在 装载 class 文件 时 ， 如 果 常 量 池 的 创建 需要 比 Java 虚拟 机 的 方法 区 中 需求 更 多 的 内 
存 时 ， 将 会 殷 出 OutOfMemoryError 异常 。 

注意 : 对 于 虚拟 机 运行 时 数据 区 域 的 划分 及 每 个 区 域 作用 ， 存 储 内 容 及 可 能 出 现 的 异 
常 有 了 一 个 大 致 的 了 解 。Java 的 自动 内 存 分 配 和 垃圾 回收 筑 起 的 这 道 高 墙 ， 在 出 现 内 存 泄 
露 或 者 溢出 的 情况 下 ， 这 道 高 墙 就 必须 翻越 了 。 


8.2.7 ”直接 内 存 (Direct Memory) 


直接 内 存 并 不 是 虚拟 机 运行 时 数据 区 的 一 部 分 ， 也 不 是 Java 虚拟 机 规范 中 定义 的 内 存 
区 域 ， 但 是 这 部 分 内 存 也 被 频繁 地 使 用 ， 而 且 也 可 能 导致 OutOfMemoryError 异常 出 现 ， 
所 以 我 们 放 到 这 里 一 起 讲解 。 

从 JDK 1.4 版 本 开始 ， 新 加 入 了 NIO(New Input/Output) 类 ， 并 且 引 入 了 一 种 基于 通道 
(Channel) 与 缓冲 区 (Buffern) 的 IO 方式 ， 它 可 以 使 用 Native 函数 库 直 接 分 配 堆 外 内 存 ， 然 
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后 通过 一 个 存储 在 Java 堆 里 面 的 DirectByteBuffer 对 象 作为 这 块 内 存 的 引用 进行 操作 。 这 
样 能 在 一 些 场景 中 显著 提高 性 能 ， 因 为 避免 了 在 Java 堆 和 Native 堆 中 来 回复 制 数据 。 

显然 ， 本 机 直接 内 存 的 分 配 不 会 受到 Java 堆 大 小 的 限制 ， 但 是 既然 是 内 存 ， 肯 定 还 
是 会 受到 本 机 总 内 存 (包括 RAM 及 SWAP 区 或 者 分 页 文件 ) 的 大 小 及 处 理 器 寻 址 空间 的 限 
制 。 服 务 器 管理 员 配 置 虚拟 机 参数 时 ， 一 般 会 根据 实际 内 存 设 置 “Xmx” 等 参数 信息 ， 但 
经 常会 忽略 掉 直 接 内 存 ， 使 得 各 个 内 存 区 域 的 总 和 大 于 物理 内 存 限制 (包括 物理 上 的 和 操作 
系统 级 的 限制 )， 从 而 导致 动态 扩展 时 出 现 OutOfMemoryError 异常 。 


8.3 对 象 访问 


JVM 的 逻辑 内 存 模 型 如 图 8-4 所 示 。 


a i 程序 计 本 地 方 
数 器 法 栈 


a 


8-4 ”JVM 的 逻辑 内 存 模型 
在 本 节 的 内 容 中 ， 将 通过 逻辑 内 存 模型 来 讲解 对 象 访问 的 应 用 知识 。 


8.3.1 对 象 访问 基础 


当 我 们 建立 一 个 对 象 的 时 候 是 怎么 进行 访问 的 呢 ? 在 Java 语言 中 ， 对 象 访问 是 如 何 
进行 的 ? 对 象 访问 在 Java 语言 中 无 处 不 在 ， 是 最 普通 的 程序 行为 ， 但 即使 是 最 简单 的 访 
问 ， 也 会 却 涉及 Java 栈 、Java 堆 、 方 法 区 这 三 个 最 重要 内 存 区 域 之 间 的 关联 关系 ， 如 下 
面 的 代码 : 


Object obj = new Object(); 


假设 这 句 代 码 出 现在 方法 体 中 ， 那 “Object obj” 这 部 分 的 语义 将 会 反映 到 Java 栈 的 
本 地 变量 表 中 ， 作 为 一 个 reference 类 型 数据 出 现 。 而 “new Object0” 这 部 分 的 语义 将 会 
反映 到 Java 堆 中 ， 形 成 一 块 存储 了 Object 类 型 所 有 实例 数据 值 (Instance Data， 对 象 中 各 
个 实例 字段 的 数据 ) 的 结构 化 内 存 ， 根 据 具 体 类 型 以 及 虚拟 机 实现 的 对 象 内 存 布 局 (Object 
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Memory Layout) 的 不 同 ， 这 块 内 存 的 长 度 是 不 固定 的 。 另 外 ， 在 Java 堆 中 还 必须 包含 能 查 
找到 此 对 象 类 型 数据 (如 对 象 类 型 、 父 类 、 实 现 的 接口 、 方 法 等 ) 的 地 址 信息 ， 这 些 类 型 数 
据 则 存储 在 方法 区 中 。 

由 于 reference 类 型 在 Java 虚拟 机 规范 里 面 只 规定 了 一 个 指向 对 象 的 引用 ， 并 没有 定 
义 这 个 引用 应 该 通过 哪 种 方式 去 定位 ， 以 及 访问 到 Java 堆 中 对 象 的 具体 位 置 ， 因 此 不 同 
虚拟 机 实现 的 对 象 访 问 方式 会 有 所 不 同 ， 主 流 的 访问 方式 有 两 种 : 使 用 句柄 和 直接 指针 。 

(1) 如 果 使 用 句柄 访问 方式 ，Java 堆 中 将 会 划分 出 一 块 内 存 来 作为 句柄 池 ，reference 
中 存储 的 就 是 对 象 的 句柄 地 址 ， 而 句柄 中 包含 了 对 象 实例 数据 和 类 型 数据 各 自 的 具体 地 址 
信息 ， 如 图 8-5 所 示 。 


Java 栈 : Java 推 
本 地 变量 表 句柄 池 : 实例 池 
到 对 象 实例 数据 的 指 计 | 一 、;、 


: 
到 对 象 类 型 数据 的 指针 ; 对 象 实例 数据 
[eforenee | 


| am | 


对 象 类 型 数据 
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(2) 如 果 使 用 直接 指针 访问 方式 ，Java 堆 对 象 的 布局 中 就 必须 考虑 如 何 放置 访问 类 型 
数据 的 相关 信息 ，reference 中 直接 存储 的 就 是 对 象 地 址 ， 如 图 8-6 所 示 。 


Java 栈 
本 地 变量 表 
到 对 象 类 型 数据 的 指针 
对 象 实例 数据 


double 


| SO 
| 
[| 


8-6 ”通过 指针 访问 对 象 


fi ava 
CS 


权衡 优化、 高效 和 安全 的 最 优 方案 


这 两 种 对 象 的 访问 方式 各 有 优势 ， 使 用 句柄 访问 方式 的 最 大 好 处 就 是 reference 中 存储 
的 是 稳定 的 句柄 地 址 ， 在 对 象 被 移动 (垃圾 收集 时 移动 对 象 是 非常 普遍 的 行为 ) 时 只 会 改变 
句柄 中 的 实例 数据 指针 ， 而 reference 本 身 不 需要 被 修改 。 

使 用 直接 指针 访问 方式 的 最 大 好 处 就 是 速度 更 快 ， 它 节省 了 一 次 指针 定位 的 时 间 开 
销 ， 由 于 对 象 的 访问 在 Java 中 非常 频繁 ， 因 此 这 类 开销 积 少 成 多 后 也 是 一 项 非常 可 观 的 
执行 成 本 。 就 本 书 讨论 的 主要 虚拟 机 Sun HotSpot 而 言 ， 它 是 使 用 第 二 种 方式 进行 对 象 访 
问 的 ， 但 从 整个 软件 开发 的 范围 来 看 ， 各 种 语言 和 框架 使 用 句柄 来 访问 的 情况 也 十 分 
常见 。 


8.3.2 具体 测试 
在 本 节 的 内 容 中 ， 将 通过 几 个 示例 来 演示 JVM 内 存 操作 的 基本 知识 。 


1. Java 堆 溢 出 


在 示例 中 我 们 限制 Java 堆 的 大 小 为 20MB， 不 可 扩展 (将 堆 的 最 小 值 -Xms 参数 与 最 大 
值 -Xmx 参数 设置 为 一 样 即 可 避免 堆 自 动 扩展 )， 通 过 参数 -XX:+HeapDumpOnOutOf 
MemoryError 可 以 让 虚拟 机 在 出 现 内 存 溢出 异常 时 Dump 出 当前 的 内 存 堆 转 储 快照 以 便 事 
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图 8-9 参数 设置 (1) 
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图 8-8 参数 设置 (2) 


图 8-9 参数 设置 (3) 
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下 面 是 测试 代码 : 


package com.yhj.jvm.memory.heap; 

import java.util.ArrayList; 

import java.util.List; 

public class HeapOutOfMemory { 

public static void main(String[] args) { 
List<TestCase> cases = new ArrayList<TestCase>(); 
while (true) { 
cases.add (new TestCase()); 
1 
} 

} 

class TestCasef{f 

} 

运行 后 会 输出 : 

java.lang.OutOofMemoryError: Java heap space 
Dumping heap to java pid3404.hprof .. 
Heap dump file created [22045981 bytes in 0.663 secs] 

Java 堆 内 存 的 OOM 异常 是 实际 应 用 中 最 常见 的 内 存 溢 出 异常 情况 。 出 现 Java 堆 内 存 
溢出 时 ， 异 常 堆栈 信息 java.lang.OutOfMemoryError 会 跟着 进一步 提示 “Java heap 
space” 。 

要 解决 这 个 区 域 的 异常 ， 一 般 的 手段 是 首先 通过 内 存 映像 分 析 工 具 ( 如 EclipseMemory 
Analyzer) 对 dump 出 来 的 堆 转 储 快照 进行 分 析 ， 重 点 是 确认 内 存 中 的 对 象 是 否 是 必要 的 ， 
也 就 是 要 先 分 清楚 到 底 是 出 现 了 内 存 泄露 (Memory Leak) 还 是 内 存 溢出 (Memory 
Overflow)。 如 果 是 内 存 泄 露 ， 可 进一步 通过 工具 查看 泄露 对 象 到 GC Roots 的 引用 链 。 于 
是 就 能 找到 泄露 对 象 是 通过 怎样 的 路 径 与 GC Roots 相关 联 并 导致 垃圾 收集 器 无 法 自动 回 
收 它们 的 。 掌 握 了 泄露 对 象 的 类 型 信息 ， 以 及 GC Roots 引用 链 的 信息 ， 就 可 以 比较 准确 
地 定位 出 泄露 代码 的 位 置 。 如 果 不 存在 泄露 ， 换 句 话 说 就 是 内 存 中 的 对 象 确实 都 还 必须 存 
活着 ， 那 就 应 当 检查 虚拟 机 的 堆 参 数 (-Xmx 与 -Xms)， 与 机 器 物理 内 存 对 比 看 是 否 还 可 以 
调 大 ， 从 代码 上 检查 是 否 存在 某 些 对 象 生命 周期 过 长 、 持 有 状态 时 间 过 长 的 情况 ， 尝 试 减 
少 程序 运行 期 的 内 存 消 耗 。 

2. 虚拟 机 栈 和 本 地 方法 栈 溢出 


由 于 在 HotSpot 虚拟 机 中 并 不 区 分 虚拟 机 栈 和 本 地 方法 栈 ， 因 此 对 于 HotSpot 来 说 ， 
-Xoss 参数 (设置 本 地 方法 栈 大 小 ) 虽 然 存 在 ， 但 实际 上 是 无 效 的 ， 栈 容量 只 由 -Xss 参数 设 
定 。 关 于 虚拟 机 栈 和 本 地 方法 栈 ， 在 Java 虚拟 机 规范 中 描述 了 两 种 异常 : 

口 如 果 线 程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 最 大 深度 ， 将 抛 出 

StackOverflowError 异常 。 

口 “ 如 果 虚 拟 机 在 扩展 栈 时 无 法 申请 到 足够 的 内 存 空间 ， 则 抛 出 OutOfMemoryError 

异常 。 

这 里 把 异常 分 成 两 种 情况 看 似 更 加 严谨 ， 但 却 存在 着 一 些 互相 重 又 的 地 方 ， 当 栈 空间 
无 法 继续 分 配 时 ， 到 底 是 内 存 太 小 ， 还 是 已 使 用 的 栈 空间 太 大 ， 其 本 质 上 只 是 对 同一 件 事 
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情 的 两 种 描述 而 已 。 


在 具体 测试 中 会 发 现 ， 如 果 将 实验 范围 限制 于 单线 程 中 的 操作 ， 尝 试 了 下 面 两 种 方法 
均 无 法 让 虚拟 机 产生 OutOfMemoryError 异常 ， 尝 试 的 结果 都 是 获得 StackOverflowError 
异常 。 

例如 下 面 的 代码 会 造成 栈 溢出 : 


package com.yhj.jvm.memory.stack; 
public class StackOverFlow { 
private int i ; 
public void plus() { 
i++? 
plus(); 
} 
public static void main(String[] args) { 
StackOverFlow stackOverFlow = new StackOverFlow(); 
try { 
stackOverFlow.plus (); 
} catch (Exception e) { 
System.out .println ("Exception:stack length:"+stackOverFlow.i); 
e.printstackTrace(); 
} catch (Error e) { 
System.out .println("Error:stack length:"+stackOverFlow.i); 
e.printstackTrace (); 
} 
} 
} 


通过 测试 表明 : 在 单个 线程 下 ， 无 论 是 由 于 栈 帧 太 大 ， 还 是 虚拟 机 栈 容量 太 小 ， 当 内 
存 无 法 分 配 的 时 候 ， 虚 拟 机 抛 出 的 都 是 StackOverflowError 异常 。 如 果 测 试 时 不 限于 单线 
程 ， 通 过 不 断 地 建立 线程 的 方式 倒是 可 以 产生 内 存 溢 出 异常 。 但 是 ， 这 样 产生 的 内 存 溢出 
异常 与 栈 空间 是 否 足够 大 并 不 存在 任何 联系 ， 或 者 准确 地 说 ， 在 这 种 情况 下 ， 给 每 个 线程 
的 栈 分 配 的 内 存 越 大 ， 反 而 越 容易 产生 内 存 溢 出 异常 。 原 因 其 实 不 难 理解 ， 操 作 系 统 分 配 
给 每 个 进程 的 内 存 是 有 限制 的 ， 壁 如 32 位 的 Windows 限制 为 2GB。 虚 拟 机 提供 了 参数 来 
控制 Java 堆 和 方法 区 的 这 两 部 分 内 存 的 最 大 值 。 剩 余 的 内 存 为 2GB( 操 作 系统 限制 ) 减 去 
Xmx( 最 大 堆 容量 )， 再 减 去 MaxPermSize( 最 大 方法 区 容量 )， 程 序 计 数 器 消耗 内 存 很 小 ， 可 
以 忽略 掉 。 如 果 虚 拟 机 进程 本 身 耗 费 的 内 存 不 计算 在 内 ， 剩 下 的 内 存 就 由 虚拟 机 栈 和 本 地 
方法 栈 “ 瓜 分 ”了 。 每 个 线程 分 配 到 的 栈 容量 越 大 ， 可 以 建立 的 线程 数量 自然 就 越 少 ， 建 
立 线程 时 就 越 容易 把 剩 下 的 内 存 耗 尽 。 这 一 点 读者 需要 在 开发 多 线程 应 用 的 时 候 特 别 注 
意 ， 出 现 StackOverflowError 异常 时 有 错误 堆栈 可 以 阅读 ， 相 对 来 说 ， 比 较 容易 找到 问题 
的 所 在 。 而 且 ， 如 果 使 用 虚拟 机 默认 参数 ， 栈 深度 在 大 多 数 情况 下 (因为 每 个 方法 压 入 栈 的 
帧 大 小 并 不 是 一 样 的 ， 所 以 只 能 说 大 多 数 情况 下 ) 达 到 1000 一 2000 完全 没有 问题 ， 对 于 正 
常 的 方法 调用 (包括 递归 )， 这 个 深度 应 该 完全 够 用 了 。 但 是 ， 如 果 是 建立 过 多 线程 导致 的 
内 存 溢出 ， 在 不 能 减少 线程 数 或 者 更 换 64 位 虚拟 机 的 情况 下 ， 就 只 能 通过 减少 最 大 堆 和 
减少 栈 容量 来 换取 更 多 的 线程 。 如 果 没 有 这 方面 的 经 验 ， 这 种 通过 “减少 内 存 ” 的 手段 来 
解决 内 存 溢 出 的 方式 会 比较 难以 想到 。 
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例如 下 面 的 代码 在 创建 线程 时 会 导致 OOM 异常 。 


public class JavaVMStackOOM { 
private void dontstop() { 
while (true) { 
} 


} 
public void stackLeakByThread() { 
while (true) { 
Thread thread = new Thread (new Runnable() { 
QOverride 
public void run() { 
dontStop () ; 
} 
]) 7 
thread.start (); 
} 
1 
public static void main(String[] args) throws Throwable { 
JavaVMStackOOM oom = new JavaVMStackOOM() ; 
oom.stackLeakByThread () ; 


} 


如 果 读者 要 运行 上 面 这 段 代码 ， 记 得 要 把 当前 工作 存盘 ， 上 述 代码 执行 时 有 很 大 令 操 
作 系 统 卡 死 的 风险 。 运 行 后 会 输出 : 


Exception in thread "main" java.lang.OutOofMemoryError: unable to create new 
native thread 


3. 运行 时 常量 池 


如 果 要 向 运行 时 常量 池 中 添加 内 容 ， 最 简单 的 做 法 就 是 使 用 String.intem() 这 个 Native 
方法 。 该 方法 的 作用 是 : 如 果 池 中 已 经 包含 一 个 等 于 此 String 对 象 的 字符 串 ， 则 返回 代表 
池 中 这 个 字符 串 的 String 对 象 ， 否 则 ， 将 此 String 对 象 包含 的 字符 串 添加 到 常量 池 中 ， 并 
且 返 回 此 String 对 象 的 引用 。 由 于 常量 池 分 配 在 方法 区 内 ， 我 们 可 以 通过 -XX:PermSize 和 
-XX:MaxPermSize 限制 方法 区 的 大 小 ， 从 而 间接 限制 其 中 常量 池 的 容量 。 例 如 下 面 的 
代码 。 


package com.yhj.jwm.memory.constant; 
import java.util.ArrayList; 
import java.util.List; 
public class ConstantOutOfMemory { 
public static void main(string[] args) throws Exception { 


try { 
List<String> strings = new ArrayList<string>(); 
int i = 0; 


while (true) { 
strings.add(String-valueOf (i++) .intern ()); 
} 
} catch (Exception e) { 
e.printstackTrace(); 
throw e; 
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} 


并 且 从 运行 结果 中 可 以 看 到 ， 运 行 时 常量 池 溢 出 ， 在 OutOfMemoryError 后 面 跟随 的 
提示 信息 是 “PermGen space”， 说 明 运 行 时 常量 池 属 于 方法 区 (HotSpot 虚拟 机 中 的 永久 代 ) 
的 一 部 分 。 


4. 方法 区 溢出 


方法 区 用 于 存放 Class 相关 信息 ， 所 以 这 个 区 域 的 测试 我 们 借助 CGLib 直接 操作 字 节 
码 动 态 生成 大 量 的 Class。 值 得 注意 的 是 ， 这 里 我 们 这 个 例子 中 模拟 的 场景 其 实 经 常会 在 实 
际 应 用 中 出 现 一 一 当前 很 多 主流 框架 ， 如 Spring、Hibemate 对 类 进行 增强 时 ， 都 会 使 用 到 
CGLib 这 类 字 节 码 技术 ， 当 增强 的 类 越 多 ， 就 需要 越 大 的 方法 区 用 于 保证 动态 生成 的 
Class 可 以 加 载 入 内 存 。 

例如 下 面 的 代码 会 产生 方法 区 溢出 : 


package com.yhj.jvm.memory.methodArea; 
import java.lang.reflect .Method; 
import net.sf.cglib.proxy.Enhancer; 
import net.sf.cglib.proxy.MethodInterceptor; 
import net.sf.cglib.proxy.MethodProxy; 
public class MethodAreaOutOfMemory { 
public static void main(String[] args) { 
while (true) { 
Enhancer enhancer = new Enhancer(); 
enhancer.setSuperclass (TestCase.class); 
enhancer. setUseCache (false); 
enhancer.setCallback (new MethodInterceptor () { 
@Override 
public Object intercept (Object arg0, Method argl, Object[] arg2, 
MethodProxy arg3) throws Throwable { 
return arg3.invokeSuper (arg0, arg2); 


} 
1); 
enhancer.create () 7 


了 
} 
class TestCasef{ 
} 


再 看 在 下 面 的 代码 中 ， 借 助 CGLib 使 得 方法 区 出 现 OOM 异常 。 


public class JavaMethodAreaOoM { 
public static void main(String[] args) { 
while (true) { 
Enhancer enhancer = new Enhancer (); 
enhancer.setSuperclass (OOMObject .class); 
enhancer.setUseCache (false); 
enhancer.setCallback (new MethodInterceptor () { 
public Object intercept (Object obj, Method method, 
Object[] args, MethodProxy proxy) throws Throwable { 
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return proxy.invokeSuper (obj，args) 7 
} 
Ds; 
enhancer .create () 7 
| 
static class OOMObject { 
} 
} 


运行 后 会 输出 : 
Caused by: java.lang.OutOfMemoryError: PermGen space 
at java.lang.ClassLoader.defineClass]l (Native Method) 
at java.lang.ClassLoader.defineClassCond (ClassLoader .java:632) 
at java.lang.ClassLoader.defineClass (ClassLoader .java:616) 
:8more 
方法 区 溢出 也 是 一 种 常见 的 内 存 溢出 异常 ， 一 个 类 如 果 要 被 垃圾 收集 器 回收 掉 ， 判 定 
条 件 是 非常 苛刻 的 。 在 经 常 动态 生成 大 量 Class 的 应 用 中 ， 需 要 特别 注意 类 的 回收 状况 。 
这 类 场景 除了 上 面 提 到 的 程序 使 用 了 CGLIB 字 节 码 增强 外 ， 常 见 的 还 有 : 大 量 JSP 或 动 
态 产 生 JSP 文件 的 应 用 (JSP 第 一 次 运行 时 需要 编译 为 Java 类 )、 基 于 OSGi 的 应 用 (即使 是 
同一 个 类 文件 ， 被 不 同 的 加 载 器 加 载 也 会 视 为 不 同 的 类 ) 等 。 


5. 本 机 直接 内 存 


DirectMemory 容量 可 通过 -XX:MaxDirectMemorySize 指定 ， 不 指定 的 话 默认 与 Java 堆 
(-Xmx 指定 ) 一 样 ， 下 文 代码 越过 了 DirectByteBuffer， 直 接 通过 反射 获取 Unsafe 实例 进行 
内 存 分 配 (Unsafe 类 的 getUnsafe() 方 法 限制 了 只 有 引导 类 加 载 器 才 会 返回 实例 ， 也 就 是 基本 
上 只 有 rtjar 里 面 的 类 的 才能 使 用 )， 因 为 DirectByteBuffer 也 会 抛 OOM 异常 ， 但 抛 出 异常 
时 实际 上 并 没有 真正 向 操作 系统 申请 分 配 内 存 ， 而 是 通过 计算 得 知 无 法 分 配 既 会 抛 出 ， 真 
正 申请 分 配 的 方法 是 unsafe.allocateMemory()。 

例如 下 面 的 代码 : 


public class DirectMemoryOoM { 
private static final int 1MB = 1024 * 1024; 
public static void main(String[] args) throws Exception { 
Field unsafeField = Unsafe.class.getDeclaredFields () [0]; 
unsafeField.setAccessible (true); 
Unsafe unsafe = (Unsafe) unsafeField.get (null); 
while (true) { 
unsafe.allocateMemory( 1MB); 
} 
1 
} 


运行 后 会 输出 : 


Exception in thread "main" java.lang.OutOofMemoryError 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at org.fenixsoft.oom.DirectMemoryOOM.main (DirectMemoryOOM.Jjava:20) 
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8.4 内 存 泄露 


在 计算 机 科学 中 ， 内 存 泄露 (Memory Lealo) 是 指 由 于 疏忽 或 错误 造成 程序 未 能 释放 已 经 
不 再 使 用 的 内 存 的 情况 。 内 存 泄露 并 非 指 内 存在 物理 上 的 消失 ， 而 是 应 用 程序 分 配 某 段 内 
存 后 ， 由 于 设计 错误 ， 失 去 了 对 该 段 内 存 的 控制 ， 因 而 造成 了 内 存 的 浪费 。 内 存 泄露 与 许 
多 其 他 问题 有 着 相似 的 症状 ， 并 且 通 常情 况 下 只 能 由 那些 可 以 获得 程序 源 代码 的 程序 员 才 
可 以 分 析出 来 。 然 而 ， 有 不 少 人 习惯 于 把 任何 不 需要 的 内 存 使 用 的 增加 描述 为 内 存 泄露 ， 
严格 意义 上 来 说 这 是 不 准确 的 。 一 般 我 们 常 说 的 内 存 泄露 是 指 堆 内 存 的 泄露 。 堆 内 存 是 指 
程序 从 堆 中 分 配 的 ， 大 小 任意 的 (内 存 块 的 大 小 可 以 在 程序 运行 期 决定 )， 使 用 完 后 必须 显 
式 释 放 的 内 存 。 应 用 程序 一 般 使 用 malloc、realloc、new 等 函数 从 堆 中 分 配 到 一 块 内 存 ， 
使 用 完 后 ， 程 序 必须 负责 相应 的 调用 free 或 delete 释放 该 内 存 块 ， 否 则 这 块 内 存 就 不 能 被 
再 次 使 用 ， 我 们 就 说 这 块 内 存 泄露 了 。 


8.4.1 内 存 泄露 的 分 类 


内 存 泄露 通常 分 为 以 下 四 类 。 

1) 常 发 性 内 存 泄露 

发 生 内 存 泄露 的 代码 会 被 多 次 执行 到 ， 每 次 被 执行 的 时 候 都 会 导致 一 块 内 存 泄 露 。 

2) 偶发 性 内 存 泄露 

发 生 内 存 泄露 的 代码 只 有 在 某 些 特定 环境 或 操作 过 程 下 才 会 发 生 ， 常 发 性 和 偶发 性 是 
相对 的 。 对 于 特定 的 环境 ， 偶 发 性 的 也 许 就 变 成 了 常 发 性 的 。 所 以 测试 环境 和 测试 方法 对 
检测 内 存 泄露 至 关 重 要 。 

3) 一 次 性 内 存 泄 露 

发 生 内 存 泄露 的 代码 只 会 被 执行 一 次 ， 或 者 由 于 算法 上 的 缺陷 ， 导 致 总 会 有 一 块 且 仅 
一 块 内 存 发 生 泄露 。 比 如 ， 在 一 个 Singleton 类 的 构造 函数 中 分 配 内 存 ， 在 析 构 函数 中 却 没 
有 释放 该 内 存 。 而 Singleton 类 只 存在 一 个 实例 ， 所 以 内 存 泄露 只 会 发 生 一 次 。 

4) 隐 式 内 存 泄露 

程序 在 运行 过 程 中 不 停 的 分 配 内 存 ， 但 是 直到 结束 的 时 候 才 释放 内 存 。 严 格 地 说 这 里 
并 没有 发 生 内 存 泄露 ， 因 为 最 终 程序 释放 了 所 有 申请 的 内 存 。 但 是 对 于 一 个 服务 器 程序 ， 
需要 运行 几 天 ， 几 周 甚至 几 个 月 ， 不 及 时 释放 内 存 也 可 能 导致 最 终 耗 尽 系统 的 所 有 内 存 。 
所 以 ， 我 们 称 这 类 内 存 泄露 为 隐 式 内 存 泄露 。 


8.4.2 ”内 存 泄露 的 定义 


一 般 我 们 常 说 的 内 存 泄露 是 指 堆 内 存 的 泄露 。 堆 内 存 是 指 程序 从 堆 中 分 配 的 ， 大 小 任 
意 的 (内 存 块 的 大 小 可 以 在 程序 运行 期 决定 )， 使 用 完 后 必须 显示 释放 的 内 存 。 应 用 程序 一 
般 使 用 malloc、realloc、new 等 函数 从 堆 中 分 配 到 一 块 内 存 ， 使 用 完 后 ， 程 序 必须 负责 相 
应 的 调用 free 或 delete 释放 该 内 存 块 ， 否 则 ， 这 块 内 存 就 不 能 被 再 次 使 用 ， 我 们 就 说 这 块 
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开发 ; 
内 存 泄露 了 。 例 如 下 面 的 这 段 小 程序 演示 了 堆 内 存 发 生 泄露 的 情形 ; 


void MyFunction(int nSize) { 
char* p= new char[nSize]; 

if( !GetStringFrom( p, nSize ) ){ 
MessageBox( “Error” ); 

return; } 


} 


当 函 数 GetStringFromO 返 回 0 的 时 候 ， 指 针 p 指向 的 内 存 就 不 会 被 释放 。 这 是 一 种 常 
见 的 发 生 内 存 泄露 的 情形 。 程 序 在 入 口 处 分 配 内 存 ， 在 出 口 处 释放 内 存 ， 但 是 “ 函数 可 以 
在 任何 地 方 退出 ， 所 以 一 旦 有 某 个 出 口 处 没有 释放 应 该 释放 的 内 存 ， 就 会 发 生 内 存 泄露 。 


8.4.3 ”内 存 泄露 的 常见 问题 和 后 果 


内 存 泄露 会 因为 减少 可 用 内 存 的 数量 从 而 降低 计算 机 的 性 能 。 最 终 在 最 糟糕 的 情况 
下 ， 过 多 的 可 用 内 存 被 分 配 掉 导致 全 部 或 部 分 设备 停止 正常 工作 ， 或 者 应 用 程序 崩 演 。 内 
存 泄露 可 能 不 严重 ， 甚 至 能 够 被 常规 的 手段 检测 出 来 。 在 现代 操作 系统 中 ， 一 个 应 用 程序 
使 用 的 常规 内 存在 程序 终止 时 被 释放 。 这 表示 一 个 短暂 运行 的 应 用 程序 中 的 内 存 泄露 不 会 
导致 严重 后 果 。 在 以 下 情况 下 ， 内 存 泄露 会 导致 较 严 重 的 后 果 : 

口 “ 程 序 运行 后 置之不理 ， 并 且 随 着 时 间 的 流失 ， 消 耗 越 来 越 多 的 内 存 (比如 服务 器 上 
的 后 台 任务 ， 尤 其 是 嵌入 式 系统 中 的 后 台 任务 ， 这 些 任 务 可 能 被 运行 后 很 多 年 内 
都 置之不理 ); 

新 的 内 存 被 频繁 地 分 配 ， 比 如 当 显 示 电 脑 游 戏 或 动画 视频 画面 时 ; 

程序 能 够 请 求 未 被 释放 的 内 存 (比如 共享 内 存 )， 甚 至 是 在 程序 终止 的 时 候 ; 

泄露 在 操作 系统 内 部 发 生 ; 

泄露 在 系统 关键 驱动 中 发 生 ; 

内 存 非常 有 限 ， 比 如 在 嵌入 式 系统 或 便携 设备 中 ; 

当 运 行 于 一 个 终止 时 内 存 并 不 自动 释放 的 操作 系统 (比如 AmigaOS) 之 上 ， 而 且 一 
旦 丢失 只 能 通过 重启 来 恢复 。 

内 存 泄露 是 程式 设计 中 一 项 常见 错误 ,特别 是 使 用 没有 内 置 自动 垃圾 回收 的 编程 语 
言 ， 如 C 及 C++。 一 般 情况 下 ， 内 存 泄露 发 生 是 因为 不 能 存 取 动态 分 配 的 内 存 。 目 前 有 相 
当 数 量 的 调试 工具 用 于 检测 不 能 存 取 的 内 存 ， 从 而 可 以 防止 内 存 泄露 问题 ， 如 IBM 
Rational Purify、BoundsChecker、Valgrind、Insure++ 及 memwatch 都 是 为 C/C++ 程式 设计 
亦 较 受 欢 迎 的 内 存 除 错 工具 。 垃 圾 回收 则 可 以 应 用 到 任何 编程 语言 ， 而 C/C++ 也 有 此 类 函 
式 库 。 

提供 自动 内 存 管理 的 编程 语言 如 Java、VB、.NET(.NET 内 存 泄露 ) 以 及 LISP， 都 不 能 
避免 内 存 泄露 。 例 如 ， 程 式 会 把 项 目 加 入 至 列表 ， 但 在 完成 时 没有 移 除 ， 如 同人 把 物件 丢 
到 一 堆 物 品 中 或 放 到 抽 屠 内 ， 但 后 来 忘记 取 走 这 件 物 品 一 样 。 内 存 管理 器 不 能 判断 项 目 是 
否 将 再 被 存 取 ， 除 非 程式 作出 一 些 指示 表明 不 会 再 被 存 取 。 

虽然 内 存 管 理 器 可 以 回复 不 能 存 取 的 内 存 ， 但 它 不 可 以 释放 可 存 取 的 内 存 ， 因 为 仍 有 
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可 能 需要 使 用 。 现 代 的 内 存 管理 器 因此 为 程式 设计 员 提 供 技术 来 标示 内 存 的 可 用 性 ， 以 不 
同 级 别 的 “ 存 取 性 ”表示 。 内 存 管理 器 不 会 把 需要 存 取 可 能 较 高 的 对 象 释放 。 当 对 象 直接 
和 一 个 强 引 用 相关 或 者 间接 和 一 组 强 引用 相关 表示 该 对 象 存 取 性 较 强 ( 强 引 用 相对 于 弱 引 
用 ， 是 防止 对 象 被 回收 的 一 个 引用 )。 要 防止 此 类 内 存 泄露 ， 开 发 者 必须 使 用 对 象 后 清理 引 
用 ， 一 般 都 是 在 不 再 需要 时 将 引用 设 成 null， 如 果 有 可 能 ， 把 维持 强 引 用 的 事件 侦 听 器 全 
部 注销 。 
一 般 来 说 ， 自 动 内 存 管理 对 开发 者 来 讲 比较 方便 ， 因 为 他 们 不 需要 实现 释放 的 动作 ， 
或 担心 清理 内 存 的 顺序 ， 而 不 用 考虑 对 象 是 否 依然 被 引用 。 对 开发 者 来 说 ， 了 解 一 个 引用 
是 否 有 必要 保持 比 了 解 一 个 对 象 是 否 被 引用 要 简单 得 多 。 但 是 ， 自 动 内 存 管理 不 能 消除 所 
有 的 内 容 泄 露 。 

如 果 一 个 程序 存在 内 存 泄露 并 且 它 的 内 存 使 用 量 稳定 增长 ， 通 常 不 会 有 很 快 的 症状 。 
每 个 物理 系统 都 有 一 个 较 大 的 内 存量 ， 如 果 内 存 泄露 没有 被 中 止 (比如 重启 造成 泄露 的 程序 ) 
的 话 ， 它 迟早 会 造成 问题 。 大 多 数 的 现代 计算 机 操作 系统 都 有 存储 在 RAM 芯片 中 主 内 存 
和 存储 在 次 级 存储 设备 如 硬盘 中 的 虚拟 内 存 ， 内 存 分 配 是 动态 的 一 一 每 个 进程 根据 要 求 获 
得 相应 的 内 存 。 存 取 活 跃 的 页 面 文件 被 转移 到 主 内 存 以 提高 存 取 速度 ， 反 之 ， 存 取 不 活跃 
的 页 面 文件 被 转移 到 次 级 存储 设备 。 当 一 个 简单 的 进程 消耗 大 量 的 内 存 时 ， 它 通常 占用 越 
来 越 多 的 主 内 存 ， 使 其 他 程序 转 到 次 级 存储 设备 ， 使 系统 的 运行 效率 大 大 降低 。 甚 至 在 有 
内 存 泄 露 的 程序 终止 后 ， 其 他 程序 需要 相当 长 的 时 间 才 能 切换 到 主 内 存 ， 恢 复原 来 的 运行 
效率 。 

当 系统 所 有 的 内 存 全 部 耗 完 后 (包括 主 内 存 和 虚拟 内 存 ， 在 嵌入 式 系统 中 ， 仅 有 主 内 
存 )， 所 有 申请 内 存 的 操作 将 失败 。 这 通常 导致 程序 试图 申请 内 存 来 终止 自己 ， 或 造成 分 段 
内 存 访问 错误 (Segmentation Faulb。 现 在 有 一 些 专门 为 修复 这 种 情况 而 设计 的 程序 ， 常 用 
的 办 法 是 预 留 一 些 内 存 。 值 得 注意 的 是 ， 第 一 个 遭遇 得 不 到 内 存 问题 的 程序 有 时 候 并 不 是 
有 内 存 泄露 的 程序 。 一 些 多 任务 操作 系统 有 特殊 的 机 制 来 处 理 内 存 耗 尽 的 情况 ， 如 随机 终 
止 一 个 进程 (可 能 会 终止 一 些 正常 的 进程 )， 或 终止 耗 用 内 存 最 大 的 进程 (很 有 可 能 是 引起 内 
存 泄露 的 进程 )。 另 一 些 操作 系统 则 有 内 存 分 配 限制 ， 这 样 可 以 防止 任何 一 个 进程 耗 用 完整 
个 系统 的 内 存 。 这 种 设计 的 缺点 是 有 时 候 某 些 进程 确实 需要 较 大 数量 的 内 存 时 ， 如 一 些 处 
理 图 像 ， 视 频 和 科学 计算 的 进程 ， 操 作 系统 需要 重新 配置 。 如 内 存 泄露 发 生 在 内 核 ， 表 示 
操作 系统 自身 发 生 了 问题 。 那 些 没 有 完善 的 内 存 管理 的 计算 机 ， 如 嵌入 式 系统 ， 会 因为 一 
个 长 时 间 的 内 存 泄露 而 月 溃 。 一 些 被 公众 访问 的 系统 ， 如 网 络 服务 器 或 路 由 器 很 容易 被 黑 
客 攻击 ， 加 入 一 段 攻击 代码 ， 而 产生 内 存 泄露 。 


8.4.4 检测 内 存 泄露 


检测 内 存 泄露 的 关键 是 要 能 截获 住 对 分 配 内存 和 释放 内 存 的 函数 的 调用 。 截 获 住 这 两 
个 函数 ， 我 们 就 能 跟踪 每 一 块 内 存 的 生命 周期 ， 比 如 每 当成 功 的 分 配 一 块 内 存 后 ， 就 把 它 
的 指针 加 入 一 个 全 局 的 list 中 ; 每 当 释 放 一 块 内 存 ， 再 把 它 的 指针 从 list 中 删除 。 这 样 当 
程序 结束 的 时 候 ，list 中 剩余 的 指针 就 是 指向 那些 没有 被 释放 的 内 存 。 如 果 要 检测 堆 内 存 
的 泄露 ， 那 么 只 需 截获 住 malloc/realloc/free 和 new/delete 即 可 。 其 实 new/delete 最 终 也 是 


PT OO > 


fi dab 


于 /<< 权 生 优化 、 高 效 和 安全 的 及 优 方 宗 守 人 


用 malloc/free 的 ， 所 以 只 要 截获 前 面 一 组 即 可 。 对 于 其 他 的 泄露 ， 可 以 采用 类 似 的 方法 ， 
截获 住 相应 的 分 配 和 释放 函数 。 比 如 要 检测 BSTR 的 泄露 ， 就 需要 截获 
“SysAllocString/SysFreeString”; 要 检测 HMENU 的 泄露 ， 就 需要 截获 “ CreateMenu/ 
DestroyMenu ”。 但 是 有 的 资源 的 分 配 函 数 有 多 个 ， 释 放 函 数 只 有 一 个 ， 比 如 
SysAllocStringLen 也 可 以 用 来 分 配 BSTR， 这 时 就 需要 截获 多 个 分 配 函数 。 在 Windows 平 
台 下 ， 检 测 内 存 泄露 的 工具 常用 的 一 般 有 三 种 ，MS C-Runtime Library 内 建 的 检测 功能 ; 
外 挂 式 的 检测 工具 有 Purify、BoundsChecker 等 。 这 三 种 工具 各 有 优 缺 点 ，MS C-Runtime 
Library 虽然 功能 上 较 之 外 挂 式 的 工具 要 弱 ， 但 是 它 是 免费 的 ，Performance Monitor 虽然 无 
法 标示 出 发 生 问题 的 代码 ， 但 是 它 能 检测 出 隐 式 的 内 存 泄露 的 存在 ， 这 是 其 他 两 类 工具 无 
能 为 力 的 地 方 。 


8.5 垃圾 收集 初探 


本 节 将 详细 讲解 Java 虚拟 机 垃圾 收集 的 基本 知识 ， 为 读者 学 习 本 书后 面 的 知识 打下 坚 
实 的 基础 。 


8.5.1 何谓 垃圾 收集 


垃圾 收集 (Garbage Collection， 本 书简 称 GC) 提 供 了 内 存 管 理 的 机 制 ， 使 得 应 用 程序 不 
需要 在 关注 内 存 如 何 释放 ， 内 存 用 完 后 ， 垃 圾 收集 会 进行 收集 ， 这 样 就 减轻 了 因为 人 为 的 
管理 内 存 而 造成 的 错误 ， 比 如 在 C++ 语言 里 ， 出 现 内 存 泄露 时 很 常见 的 。 

Java 语言 是 目前 使 用 最 多 的 依赖 于 垃圾 收集 器 的 语言 ， 但 是 垃圾 收集 器 策略 从 20 世 
纪 60 年 代 就 已 经 流行 起 来 了 ， 比 如 Smalltalk 和 Eiffel 等 编程 语言 也 集成 了 垃圾 收集 器 的 
机 制 。 

在 堆 里 面 存放 着 Java 世界 中 几乎 所 有 的 对 象 ， 在 回收 前 首先 要 确定 这 些 对 象 之 中 哪些 
还 在 存活 ， 哪 些 已 经 “ 死 ” 了 ， 即 不 可 能 再 被 任何 途径 使 用 的 对 象 。 


8.5.2 ”常见 的 垃圾 收集 策略 


所 有 的 垃圾 收集 算法 都 面临 同一 个 问题 ， 那 就 是 找 出 应 用 程序 不 可 到 达 的 内 存 块 ， 将 
其 释放 ， 这 里 面 得 不 可 到 达 主 要 是 指 应 用 程序 已 经 没有 内 存 块 的 引用 了 ， 而 在 Java 中 ， 某 
个 对 象 对 应 用 程序 是 可 到 达 的 是 指 这 个 对 象 被 根 ( 根 主 要 是 指 类 的 静态 变量 ， 或 者 活跃 在 所 
有 线程 栈 的 对 象 的 引用 ) 引 用 或 者 对 象 被 另 一 个 可 到 达 的 对 象 引 用 。 

1. Reference Counting( 引 用 计数 ) 


引用 计数 是 最 简单 直接 的 一 种 方式 ， 这 种 方式 在 每 一 个 对 象 中 增加 一 个 引用 的 计数 ， 
这 个 计数 代表 当前 程序 有 多 少 个 引用 引用 了 此 对 象 ， 如 果 此 对 象 的 引用 计数 变 为 0， 那 么 
此 对 象 就 可 以 作为 垃圾 收集 器 的 目标 对 象 来 收集 。 

这 种 策略 的 优点 是 简单 、 直 接 ， 不 需要 暂停 整个 应 用 ; 缺点 是 需要 编译 器 的 配合 ， 
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译 器 要 生成 特殊 的 指令 来 进行 引用 计数 的 操作 ， 比 如 每 次 将 对 象 赋值 给 新 的 引用 ， 或 者 者 
对 象 的 引用 超出 了 作用 域 等 ， 并 且 不 能 处 理 循环 引用 的 问题 。 


2. 跟踪 收集 器 


跟踪 收集 器 首先 要 暂停 整个 应 用 程序 ， 然 后 开始 从 根 对 象 扫描 整个 堆 ， 判 断 扫描 的 对 
象 是 否 有 对 象 引 用 ， 在 此 需要 搞 清楚 下 面 的 三 个 问题 。 

(1) 如 果 每 次 扫描 整个 堆 ， 那 么 势必 让 GC 的 时 间 变 长 ， 从 而 影响 了 应 用 本 身 的 执 
行 。 因 此 在 JVM 里 面 采用 了 分 代 收集 ， 在 新 生 代 收 集 的 时 候 minor gc 只 需要 扫描 新 生 
代 ， 而 不 需要 扫描 老生 代 。 

(2) JVM 采用 了 分 代 收 集 以 后 ，minor gc 只 扫描 新 生 代 ， 但 是 minor gc 怎么 判断 是 否 
有 老生 代 的 对 象 引用 了 新 生 代 的 对 象 ，JVM 采用 了 卡片 标记 的 策略 ， 卡 片 标记 将 老生 代 分 
成 了 一 块 一 块 的 ， 划 分 以 后 的 每 一 个 块 就 叫做 一 个 卡片 ，JVM 采用 卡 表 维 护 了 每 一 个 块 的 
状态 ， 当 Java 程序 运行 的 时 候 ， 如 果 发 现 老生 代 对 象 引 用 或 者 释放 了 新 生 代 对 象 的 引用 ， 
那么 就 JVM 就 将 卡 表 的 状态 设置 为 脏 状 态 ， 这 样 每 次 minor gc 的 时 候 就 会 只 扫描 被 标记 
为 脏 状 态 的 卡片 ， 而 不 需要 扫描 整个 堆 。 

(3) GC 在 收集 一 个 对 象 的 时 候 会 判断 是 否 有 引用 指向 对 象 ， 在 Java 中 的 引用 主要 有 4 
种 ， 分 别 是 Strong reference、Soft reference、Weak reference 和 Phantom reference。 

© Strong Reference 

强 引用 是 Java 中 默认 采用 的 一 种 方式 ， 我 们 平时 创建 的 引用 都 属于 强 引 用 。 如 果 一 个 
对 象 没有 强 引 用 ， 那 么 对 象 就 会 被 回收 。 例 如 : 

public void testStrongReference (){ 

Object referent = new Object(); 

Object strongReference = referent; 

referent = null; 

System.gc(); 

assertNotNull (strongReference); 

} 

© Soft Reference 

软 引 用 的 对 象 在 GC 的 时 候 不 会 被 回收 ， 只 有 当 内 存 不 够 用 的 时 候 才 会 真正 的 回收 ， 
因此 软 引用 适合 缓存 的 场合 ， 这 样 使 得 缓存 中 的 对 象 可 以 尽量 的 再 内 存 中 待 长 久 一 点 。 
例如 : 

Public void testSoftReference ()1{ 

String str = "test"; 

SoftReference<String> softreference = new SoftReference<Sstring> (str); 

str=null; 

System.gc(); 

assertNotNull (softreference.get ()); 

} 


@ Weak reference 
弱 引 用 有 利于 对 象 更 快 的 被 回收 ， 假 如 一 个 对 象 没 有 强 引 用 只 有 弱 引 用 ， 那 么 在 GC 
后 ， 这 个 对 象 肯 定 会 被 回收 。 例 如 : 
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ES 


Public void testWeakReference(){ 

String str = "test"; 

WeakReference<String> weakReference = new WeakReference<String> (str); 

str=null; 

System.gc(); 

assertNull (weakReference.get ()); 

} 

@ Phantom reference 

口 ”Mark-Sweep Collector( 标 记 - 清 除 收集 器 ) 

标记 清除 收集 器 最 早 由 Lisp 的 发 明 人 于 1960 年 提出 ， 标 记 清 除 收集 器 停止 所 有 的 工 
作 ， 从 根 扫描 每 个 活跃 的 对 象 ， 然 后 标记 扫描 过 的 对 象 ， 标 记 完 成 以 后 ， 清 除 那些 没有 被 
标记 的 对 象 。 

优点 是 解决 循环 引用 的 问题 ， 并 且 不 需要 编译 器 的 配合 ， 从 而 就 不 执行 额外 的 指令 。 
缺点 是 每 个 活跃 的 对 象 都 要 进行 扫描 ， 收 集 暂停 的 时 间 比 较 长 。 

口 ”Copying Collector( 复 制 收集 器 ) 

复制 收集 器 将 内 存 分 为 两 块 一 样 大 小 空间 ， 某 一 个 时 刻 ， 只 有 一 个 空间 处 于 活跃 的 状 
态 ， 当 活跃 的 空间 满 的 时 候 ，GC 就 会 将 活跃 的 对 象 复制 到 未 使 用 的 空间 中 去 ， 原 来 不 活 
跃 的 空间 就 变 为 了 活跃 的 空间 。 

复制 收集 器 的 优点 是 只 扫描 可 以 到 达 的 对 象 ， 不 需要 扫描 所 有 的 对 象 ， 从 而 减少 了 
用 暂停 的 时 间 。 缺 点 是 需要 额外 的 空间 消耗 ， 某 一 个 时 刻 ， 总 是 有 一 dm 
态 。 复 制 对 象 需要 一 定 的 开销 。 

口 “Mark-Compact Collector( 标 记 -整理 收集 器 ) 

标记 整理 收集 器 汲取 了 标记 清除 和 复制 收集 器 的 优点 ， 它 分 两 个 阶段 执行 :第 一 个 阶 
段 首先 扫描 所 有 活跃 的 对 象 ， 并 标记 所 有 活跃 的 对 象 ， 第 二 个 阶段 首先 清除 未 标记 的 对 
象 ， 然 后 将 活跃 的 对 象 复制 到 堆 得 底部 。Mark-compact 策略 极 大 地 减少 了 内 存 碎片 ， 并 且 
不 需要 像 Copy Collector 一 样 需 要 两 倍 的 空间 。 


8.5.3 JVM 的 垃圾 收集 策略 


GC 执行 时 要 耗费 一 定 的 CPU 资源 和 时 间 ， 因 此 在 JDK1.2 以 后 ，JVM 引入 了 分 代 收 
集 的 策略 ， 其 中 对 新 生 代 采用 “Mark-Compact“ 策 略 ， 而 对 老生 代 采 用 了 “Mark-Sweep” 
的 策略 。 其 中 新 生 代 的 垃圾 收集 器 命名 为 “minor gc”， 老 生 代 的 GC 命名 为 “Full Gc” 
或 “Major GC”。 其 中 用 System.gc0 强 制 执行 的 是 Full Ge。 


1. Serial Collector 


Serial Collector 是 指 任何 时 刻 都 只 有 一 个 线程 进行 垃圾 收集 ， 这 种 策略 有 一 个 名 字 
“stop the whole world”， 它 需要 停止 整个 应 用 的 执行 。 这 种 类 型 的 收集 器 适合 于 单 CPU 
的 机 器 。 


Serial Copying Collector 


此 种 GC 用 -XX:UseSerialGC 选项 配置 ， 它 只 用 于 新 生 代 对 象 的 收集 。1.5.0 以 后 
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-XX:MaxTenuringThreshold 来 设置 对 象 复制 的 次 数 。 当 eden 空间 不 够 的 时 候 ，GC 会 将 
eden 的 活跃 对 象 和 一 个 名 叫 From survivo 的 空间 中 尚 不 够 资格 放 入 Old 代 的 对 象 复制 到 另 
外 一 个 名 字 叫 To Survivor 的 空间 。 而 此 参数 就 是 用 来 说 明 到 底 From survivor 中 的 哪些 对 
象 不 够 资格 ， 假 如 这 个 参数 设置 为 31， 那 么 也 就 是 说 只 有 对 象 复制 31 次 以 后 才 算 是 有 资 
格 的 对 象 。 

From Survivor 和 To survivor 的 角色 是 不 断 变化 的 ， 同 一 时 间 只 有 一 块 空间 处 于 使 用 状 
态 ， 这 个 空间 就 叫做 From Survivor 区 ， 当 复制 一 次 后 角色 就 发 生 了 变化 。 

如 果 复 制 的 过 程 中 发 现 To survivor 空间 已 经 满 了 ， 那 么 就 直接 复制 到 Old generation 。 

比较 大 的 对 象 也 会 直接 复制 到 Old generation， 在 开发 中 ， 我 们 应 该 尽量 避免 这 种 情况 
的 发 生 。 


Serial Mark-Compact Collector 
串 行 的 标记 -整理 收集 器 是 JDK5 update6 之 前 默认 的 老生 代 的 垃圾 收集 器 ， 此 收集 使 
得 内 存 碎 片 最 少 化 ， 但 是 它 需要 暂停 的 时 间 比 较 长 。 


2. Parallel Collector 


Parallel Collector 主要 是 为 了 应 对 多 CPU、 大 数据 量 的 环境 。Parallel Collector 又 可 以 
分 为 以 下 两 种 。 

(1) Parallel Copying Collector: 此 种 GC 用 -XX:UseParNewGC 参数 配置 ， 它 主要 用 于 
新 生 代 的 收集 ， 此 GC 可 以 配合 CMS 一 起 使 用 。 

(2) 在 1.4.1 版 本 以 后 用 : 

Parallel Mark-Compact Collector 

此 种 GC 用 -XX:UseParallelOI4GC 参数 配置 ， 此 GC 主要 用 于 老生 代 对 象 的 收集 。 
1.6.0 后 用 : 

Parallel scavenging Collector 

此 种 GC 用 -XX:UseParallelGC 参数 配置 ， 它 是 对 新 生 代 对 象 的 垃圾 收集 器 ， 但 是 它 不 
能 和 CMS 配合 使 用 ， 它 适合 于 比较 大 新 生 代 的 情况 ， 此 收集 器 起 始 于 JDK 1.4.0。 它 比较 
适合 于 对 吞吐 量 高 于 暂停 时 间 的 场合 。 


3. Concurrent Collector 


Concurrent Collector 通过 并 行 的 方式 进行 垃圾 收集 ， 这 样 就 减少 了 垃圾 收集 器 收集 一 
次 的 时 间 ， 这 种 GC 在 实时 性 要 求 高 于 吞吐 量 的 时 候 比 较 有 用 。 此 种 GC 可 以 用 参数 
-XX:UseConcMarkSweepGC 配置 ， 此 GC 主要 用 于 老生 代 和 Perm 代 的 收集 。 


8.6 ”对 象 的 生死 


在 堆 里 面 存 放 着 Java 世界 中 几乎 所 有 的 对 象 ， 在 回收 之 前 首先 要 确定 这 些 对 象 之 中 哪 
些 还 在 存活 ， 哪 些 已 经 “死去 ”了 ， 即 不 可 能 再 被 任何 途径 使 用 的 对 象 。 


0 p> 


Bf ova 以 机 开发 ; 
权衡 化 化、 高 


8.6.1 引用 计数 算法 (Reference Counting) 


最 初 的 想法 ， 也 是 很 多 教科 书 判断 对 象 是 否 存活 的 算法 是 这 样 的 : 给 对 象 中 添加 一 个 
引用 计数 器 ， 当 有 一 个 地 方 引 用 它 时 计数 器 加 1， 当 引用 失效 时 计数 器 减 1， 任 何 时 刻 计 
数 器 为 0 的 对 象 就 是 不 可 能 再 被 使 用 的 。 

客观 地 说 ， 引 用 计数 算法 实现 简单 ， 判 定 效率 很 高 ， 在 大 部 分 情况 下 它 都 是 一 个 不 错 
的 算法 ， 但 引用 计数 算法 无 法 解决 对 象 循环 引用 的 问题 。 举 个 简单 的 例子 : 对 象 A 和 了 B 分 
别 有 字 段 b、a， 令 A.b=B 和 B.a=A。 除 此 之 外 ， 这 两 个 对 象 再 无 任何 引用 ， 那 实际 上 这 两 
个 对 象 已 经 不 可 能 再 被 访问 ， 但 是 引用 计数 算法 却 无 法 回收 他 们 。 

举 一 个 简单 的 例子 ， 请 看 代码 清单 8-1 中 的 testGC() 方 法 : 对 象 objA 和 objB 都 有 字 
段 instance， 赋 值 令 objA.instance = objB 及 objB.instance = objA， 除 此 之 外 ， 这 两 个 对 象 再 
无 任何 引用 ， 实 际 上 这 两 个 对 象 已 经 不 可 能 再 被 访问 ， 但 是 它们 因为 互相 引用 着 对 方 ， 导 
致 它们 的 引用 计数 都 不 为 0， 于 是 引用 计数 算法 无 法 通知 GC 收集 器 回收 它们 。 

代码 清单 8-1 


public class ReferenceCountingGC { 
public Object instance = null; 
private static final int 1MB = 1024 * 1024; 


/** 
* 这 个 成 员 属 性 的 唯一 意义 就 是 占 点 内 存 ， 以 便 能 在 Gc 日 志 中 看 清楚 是 否 被 回收 过 
wd 
private byte[] bigSize = new byte[2 * 1MB]; 
public static void testGC() { 
ReferenceCountingGC objA = new ReferenceCountingGC () 
ReferenceCountingGC objB = new ReferenceCountingGC () 
ObjA.instance = objB; 
objB.instance = objA; 


null; 
null; 


objA 
objB 


// 假设 在 这 行 发 生 GC， 那么 objA 和 objB 是 否 能 被 回收 ? 
System.gc(); 
} 
} 
运行 结果 : 
[Full GC (System) [Tenured: OK->210K(10240K), 0.0149142 
secs] 4603K->210K(19456K), [Perm : 2999K->2999K (21248K) ] ， 
0.0150007 secs] [Times: user=0.01 sys=0.00, real=0.02 secs] 
Heap 
def new generation total 9216K, used 82K 
[Ox00000000055e0000, 0x0000000005fe0000, 0x0000000005fe0000) 
Eden space 8192K, 1$% used [0x00000000055e0000, 
0x00000000055£4850, 0x0000000005de0000) 
from space 1024K, 0% used [0x0000000005de0000, 
Ox0000000005de0000, 0x0000000005ee0000) 
to space 1024K, 0% used [0x0000000005ee0000, 


四 < NA dd ed 


第 8 章 内存 异常 和 垃圾 处 理 


Ox0000000005ee0000, 0x0000000005fe0000) 
tenured generation total 10240K, used 210K 
[0x0000000005fe0000, 0x00000000069e0000, 0x00000000069e0000) 
the space 10240K, 2% used [0x0000000005fe0000, 
Ox0000000006014al8, 0x0000000006014c00, 0x00000000069e0000) 
compacting perm gen total 21248K, used 3016K 
[Ox00000000069e0000, 0x0000000007ea0000, 0x000000000bde0000) 
the space 21248K, 14% used [0x00000000069e0000, 
Ox0000000006cd2398, 0x0000000006cd2400, 0x0000000007ea0000) 
No shared spaces configured. 
从 运行 结果 中 可 以 清楚 地 看 到 GC 日 志 中 包含 “4603K->210K”， 意 味 着 虚拟 机 并 没 
有 因为 这 两 个 对 象 互 相 引用 就 不 回收 它们 ， 这 也 从 侧面 说 明 虚 拟 机 并 不 是 通过 引用 计数 算 


法 来 判断 对 象 是 否 存 活 的 。 


8.6.2” 根 搜索 算法 


在 主流 的 商用 程序 语言 中 ， 例 如 Java 和 C# 都 是 使 用 根 搜索 算法 (GC Roots Tracing) 判 
定 对 象 是 否 存活 的 。 这 个 算法 的 基本 思路 就 是 通过 一 系列 的 名 为 “GC Roots” 的 对 象 作为 
起 始点 ， 从 这 些 节点 开始 向 下 搜索 ， 搜 索 所 走 过 的 路 径 称 为 引用 链 (Reference Chain)， 当 一 
个 对 象 到 GC Roots 没有 任何 引用 链 相连 (用 图 论 的 话 来 说 就 是 从 GC Roots 到 这 个 对 象 不 可 
达 ) 时 ， 则 证 明 此 对 象 是 不 可 用 的 。 如 图 8-10 所 示 ， 对 象 object 5、object 6、object 7 虽然 
互相 有 关联 ， 但 是 它们 到 GC Roots 是 不 可 达 的 ， 所 以 它们 将 会 被 判定 为 是 可 回收 的 对 象 。 


GC Roots 
J 
ee object 5 
二 > 
object 2 object 3 2 
亚 object 6 object 7 
object 4 


object 4 表示 仍然 存活 的 对 象 


object 6 表示 判定 可 回收 的 对 象 


图 8-10 ” 根 搜索 算法 判定 对 象 是 否 可 回收 


在 Java 语言 里 ， 可 作为 GC Roots 的 对 象 包括 下 面 几 种 : 

口 ”虚拟 机 栈 ( 栈 帧 中 的 本 地 变量 表 ) 中 的 引用 的 对 象 。 

口 “方法 区 中 的 类 静态 属性 引用 的 对 象 。 

口 “方法 区 中 的 常量 引用 的 对 象 。 

口 “ 本 地 方法 栈 中 JNI( 即 一 般 说 的 Native 方法 ) 引 用 的 对 象 。 


A p> 


oda, 


ti 


8.6.3 ”再 谈 引 用 


无 论 是 通过 引用 计数 算法 判断 对 象 的 引用 数量 ， 还 是 通过 根 搜索 算法 判断 对 象 的 引用 
链 是 否 可 达 ， 判 定 对 象 是 否 存 活 都 与 “引用 ”有 关 。 在 JDK 1.2 版 本 之 前 ，Java 中 的 引用 
的 定义 很 传统 : 如 果 reference 类 型 的 数据 中 存储 的 数值 代表 的 是 另外 一 块 内 存 的 起 始 地 
址 ， 就 称 这 块 内 存 代表 着 一 个 引用 。 这 种 定义 很 纯粹 ， 但 是 太 过 狭隘 ， 一 个 对 象 在 这 种 定 
义 下 只 有 被 引用 或 者 没有 被 引用 两 种 状态 ， 对 于 如 何 描述 一 些 “ 食 之 无 味 ， 弃 之 可 惜 ”的 
对 象 就 显得 无 能 为 力 。 我 们 希望 能 描述 这 样 一 类 对 象 : 当 内 存 空间 还 足够 时 ， 则 能 保留 在 
内 存 之 中 ; 如 果 内 存在 进行 垃圾 收集 后 还 是 非常 紧张 ， 则 可 以 抛弃 这 些 对 象 。 很 多 系统 的 
缓存 功能 都 符合 这 样 的 应 用 场景 。 

在 JDK 1.2 版 本 之 后 ，Java 对 引用 的 概念 进行 了 扩充 ， 将 引用 分 为 强 引用 (Strong 
Reference)、 软 引用 (Soft Reference)、 弱 引用 (Weak Reference)、 虚 引用 (Phantom Reference)4 
种 ， 这 4 种 引用 强度 依次 逐渐 减弱 。 

强 引 用 就 是 指 在 程序 代码 之 中 普遍 存在 的 ， 类 似 “Object obj = new Object0 ”这 类 的 
引用 ， 只 要 强 引用 还 存在 ， 垃 圾 收集 器 就 永远 不 会 回收 掉 被 引用 的 对 象 。 

软 引 用 用 来 描述 一 些 还 有 用 ， 但 并 非 必需 的 对 象 。 对 于 软 引用 关联 着 的 对 象 ， 在 系统 
将 要 发 生 内 存 溢出 异常 之 前 ， 将 会 把 这 些 对 象 列 进 回 收 范围 之 中 并 进行 第 二 次 回收 。 如 果 
这 次 回收 还 是 没有 足够 的 内 存 ， 才 会 抛 出 内 存 溢 出 异常 。 在 JDK 1.2 之 后 ， 提 供 了 Soft 
Reference 类 来 实现 软 引 用 。 

弱 引用 也 是 用 来 描述 非 必需 对 象 的 ， 但 是 它 的 强度 比 软 引 用 更 弱 一 些 ， 被 弱 引 用 关联 
的 对 象 只 能 生存 到 下 一 次 垃圾 收集 发 生 之 前 。 当 垃圾 收集 器 工作 时 ， 无 论 当 前 内 存 是 否 足 
够 ， 都 会 回收 掉 只 被 弱 引 用 关联 的 对 象 。 在 JDK 1.2 之 后 ， 提 供 了 Weak Reference 类 来 实 
现 弱 引用 。 

虚 引 用 也 称 为 幽灵 引用 或 者 幻影 引用 ， 这 是 最 弱 的 一 种 引用 关系 。 一 个 对 象 是 否 有 虚 
引用 的 存在 ， 完 全 不 会 对 其 生存 时 间 构 成 影响 ， 也 无 法 通过 虚 引 用 来 取得 一 个 对 象 实例 。 
为 一 个 对 象 设置 虚 引 用 关联 的 唯一 目的 就 是 希望 能 在 这 个 对 象 被 收集 器 回收 时 收 到 一 个 系 
统 通 知 。 在 JDK 1.2 之 后 ， 提 供 了 Phantom Reference 类 来 实现 虚 引 用 。 


8.6.4 生存 还 是 死亡 


在 根 搜索 算法 中 不 可 达 的 对 象 也 并 非 是 “ 非 死 不 可 ”的 ， 这 时 候 它们 暂时 处 于 “组 
刑 ” 阶 段 ， 要 真正 宣告 一 个 对 象 死亡 ， 至 少 要 经 历 两 次 标记 过 程 : 如 果 对 象 在 进行 根 搜索 
后 发 现 没有 与 GC Roots 相连 接 的 引用 链 ， 那 它 将 会 被 第 一 次 标记 并 且 进 行 一 次 筛选 ， 筛 
选 的 条 件 是 此 对 象 是 否 有 必要 执行 fimalize() 方 法 。 当 对 象 没有 覆盖 finalize() 方 法 ， 或 者 
finalize() 方 法 已 经 被 虚拟 机 调用 过 时 ， 虚 拟 机 将 这 两 种 情况 都 视 为 “没有 必要 执行 ”。 

如 果 这 个 对 象 被 判定 为 有 必要 执行 finalize() 方 法 ， 那 么 这 个 对 象 将 会 被 放置 在 一 个 名 
为 F-Queue 的 队列 之 中 ， 并 在 稍 后 由 一 条 由 虚拟 机 自动 建立 的 、 低 优先 级 的 Finalizer 线程 
去 执行 。 这 里 所 谓 的 “执行 ”是 指 虚拟 机 会 触发 这 个 方法 ， 但 并 不 承诺 会 等 待 它 运行 结 
束 。 这 样 做 的 原因 是 ， 如 果 一 个 对 象 在 finalize() 方 法 中 执行 缓慢 ， 或 者 发 生 了 死 循环 (更 极 
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端的 情况 )， 将 很 可 能 会 导致 F-Queue 队列 中 的 其 他 对 象 永久 处 于 等 待 状态 ， 甚 至 导致 整个 
内 存 回收 系统 骨 溃 。finalize() 方 法 是 对 象 逃脱 死亡 命运 的 最 后 一 次 机 会 ， 稍 后 GC 将 对 F- 
Queue 中 的 对 象 进行 第 二 次 小 规模 的 标记 ， 如 果 对 象 要 在 finalize0 中 成 功 拯救 自己 一 只 要 
重新 与 引用 链 上 的 任何 一 个 对 象 建立 关联 即 可 ， 璧 如 把 自己 (this 关键 字 ) 赋 值 给 某 个 类 变量 
或 对 象 的 成 员 变量 ， 那 在 第 二 次 标记 时 它 将 被 移 除 出 “即将 回收 ”的 集合 ， 如果 对 象 这 时 
候 还 没有 逃脱 ， 那 它 就 真 的 离 死 不 远 了 。 从 代码 清单 8-2 中 我 们 可 以 看 到 一 个 对 象 的 
finalize0 被 执行 ， 但 是 它 仍 然 可 以 存活 。 
代码 清单 8-2 


/** 
* 此 代码 演示 了 两 点 : 
x* .对 象 可 以 在 被 GC 时 自我 拯救 。 
*2 .这 种 自救 的 机 会 只 有 一 次 ， 因 为 一 个 对 象 的 finalize 

() 方 法 最 多 只 会 被 系统 自动 调用 一 次 
*@authorzzm 
入 
publicclassFinalizeEscapeGC{ 
publicstaticFinalizeEscapeGCSAVE HOOK=null; 
publicvoidisAlive(){ 

System.out.println ("yes,iamstillalive:)"); 
} 
@Override 
protectedvoidfinalize()throwsThrowable{ 

super.finalize(); 

System.out.println ("finalizemehtodexecuted!"); 
FinalizeEscapeGC.SAVE HOOK=this; 
} 
publicstaticvoidmain (String[]args)throwsThrowable{ 
SAVE HOOK=newFinalizeEscapeGC(); 

// 对 象 第 一 次 成 功 拯救 自己 

SAVE HOOK=null; 

System.gc() :7 

// 因 为 Finalizer 方法 优先 级 很 低 ， 暂 停 0. 5 秒 ， 以 等 待 它 
Thread.sleep(500); 

if (SAVE HOOK!=null1)t{ 

SAVE HOOK.isAlive(); 

}else{ 

System.out.println ("no,iamdead: ("); 

1 


// 下 面 这 段 代码 与 上 面 的 完全 相同 ， 但 是 这 次 自救 却 失败 了 
SAVE HOOK=null; 

System.gc(); 

// 因 为 Finalizer 方法 优先 级 很 低 ， 暂 停 0.5 秒 ， 以 等 待 它 
Thread.sleep(500); 

if (SAVE HOOK!=null1){ 

SAVE HOOK.isAlive(); 

}elsef{ 

System.out.println ("no,iamdead: ("); 
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运行 结果 : 

finalizemehtodexecuted! 

yes, iamstillalive:) 

no,iamdead: ( 

从 代码 清单 8-2 的 运行 结果 可 以 看 到 ，SAVE_HOOK 对 象 的 finalize() 方 法 确实 被 GC 
收集 器 触发 过 ， 并 且 在 被 收集 前 成 功 逃 脱 了 。 

另外 一 个 值得 注意 的 地 方 就 是 ， 代 码 中 有 两 段 完 全 一 样 的 代码 片段 ， 执 行 结果 却 是 一 
次 逃脱 成 功 ， 一 次 失败 ， 这 是 因为 任何 一 个 对 象 的 finalize() 方 法 都 只 会 被 系统 自动 调用 一 
次 ， 如 果 对 象 面临 下 一 次 回收 ， 它 的 finalize() 方 法 不 会 被 再 次 执行 ， 因 此 第 二 段 代 码 的 自 
救 行动 失败 了 。 

需要 特别 说 明 的 是 ， 上 面 关于 对 象 “死亡 ”时 finalize() 方 法 的 描述 可 能 带 有 悲情 的 艺 
术 色彩 ， 笔 者 并 不 鼓励 大 家 使 用 这 种 方法 来 拯救 对 象 。 相 反 ， 笔 者 建议 大 家 尽量 避免 使 用 
它 ， 因 为 它 不 是 C/C++ 中 的 析 构 函数 ， 而 是 Java 刚 诞生 时 为 了 使 C/C++ 程序 员 更 容易 接受 
它 所 做 出 的 一 个 妥协 。 它 的 运行 代价 高 晶 ， 不 确定 性 大 ， 无 法 保证 各 个 对 象 的 调用 顺序 。 
有 些 教材 中 提 到 它 适 合 做 “关闭 外 部 资源 ”之 类 的 工作 ， 这 完全 是 对 这 种 方法 的 用 途 的 一 
种 自我 安慰 。finalize() 能 做 的 所 有 工作 ， 使 用 try-finally 或 其 他 方式 都 可 以 做 得 更 好 、 更 及 
时 ， 大 家 完全 可 以 忘掉 Java 语言 中 还 有 这 个 方法 的 存在 。 


8.6.5 ”回收 方法 区 


很 多 人 认为 方法 区 (或 者 HotSpot 虚拟 机 中 的 永久 代 ) 是 没有 垃圾 收集 的 ，Java 虚拟 机 
规范 中 确实 说 过 可 以 不 要 求 虚拟 机 在 方法 区 实现 垃圾 收集 ， 而 且 在 方法 区 进行 垃圾 收集 的 
“性 价 比 ”一 般 比较 低 : 在 堆 中 ， 尤 其 是 在 新 生 代 中 ， 常 规 应 用 进行 一 次 垃圾 收集 一 般 可 
以 回收 70%~95% 的 空间 ， 而 永久 代 的 垃圾 收集 效率 远 低 于 此 。 

永久 代 的 垃圾 收集 主要 回收 两 部 分 内 容 : 废弃 常量 和 无 用 的 类 。 回 收 废弃 常量 与 回收 
Java 堆 中 的 对 象 非常 类 似 。 以 常量 池 中 字面 量 的 回收 为 例 ， 假 如 一 个 字符 串 “abc” 已 经 进 
入 了 常量 池 中 ， 但 是 当前 系统 没有 任何 一 个 String 对 象 是 叫做 “abc” 的 ， 换 句 话 说 是 没有 
任何 String 对 象 引用 常量 池 中 的 “abc” 常 量 ， 也 没有 其 他 地 方 引用 了 这 个 字面 量 ， 如 果 在 
这 时 候 发 生 内 存 回收 ， 而 且 必 要 的 话 ， 这 个 “abc” 常 量 就 会 被 系统 “请 ”出 常量 池 。 常 量 
池 中 的 其 他 类 (接口 )、 方 法 、 字 段 的 符号 引用 也 与 此 类 似 。 

判定 一 个 常量 是 否 是 “废弃 常量 ”比较 简单 ， 而 要 判定 一 个 类 是 否 是 “无 用 的 类 ”的 
条 件 则 相对 苛刻 许多 。 类 需要 同时 满足 下 面 3 个 条 件 才能 算是 “无 用 的 类 ”: 

口 ”该 类 所 有 的 实例 都 已 经 被 回收 ， 也 就 是 Java 堆 中 不 存在 该 类 的 任何 实例 。 

口 ”加载 该 类 的 ClassLoader 已 经 被 回收 。 

口 ” 该 类 对 应 的 java.lang.Class 对 象 没有 在 任何 地 方 被 引用 ， 无 法 在 任何 地 方 通过 反 

射 访问 该 类 的 方法 。 

虚拟 机 可 以 对 满足 上 述 3 个 条 件 的 无 用 类 进行 回收 ， 这 里 说 的 仅仅 是 “可 以 ”， 而 不 
是 和 对 象 一 样 ， 不 使 用 了 就 必然 会 回收 。 是 否 对 类 进行 回收 ，HotSpot 虚拟 机 提供 了 
-Xnoclassgc 参数 进行 控制 ， 还 可 以 使 用 -verbose:class 及 -XX:+TraceClassLoading、 
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-XX:+TraceClassUnLoading 查看 类 的 加 载 和 卸载 信息 。 

在 大 量 使 用 反射 、 动 态 代理 、CGLib 等 bytecode 框架 的 场景 ， 以 及 动态 生成 JSP 和 
OSGi 这 类 频繁 自 定义 ClassLoader 的 场景 都 需要 虚拟 机 具备 类 卸载 的 功能 ， 以 保证 永久 代 
不 会 溢出 。 


8.7 ”垃圾 收集 算法 


由 于 垃圾 收集 算法 的 实现 涉及 大 量 的 程序 细节 ， 而 且 各 个 平台 的 虚拟 机 操作 内 存 的 方 
法 又 各 不 相同 ， 因 此 本 节 不 打算 过 多 地 讨论 算法 的 实现 ， 只 是 介绍 几 种 算法 的 思想 及 其 发 


8.7.1 标记 -清除 算法 


最 基础 的 收集 算法 是 “标记 -清除 ”(Mark-Sweep) 算 法 ， 如 它 的 名 字 一 样 ， 算 法 分 为 
“标记 ”和 “清除 ”两 个 阶段 : 首先 标记 出 所 有 需要 回收 的 对 象 ， 在 标记 完成 后 统一 回收 
掉 所 有 被 标记 的 对 象 ， 它 的 标记 过 程 其 实在 前 一 节 讲 述 对 象 标记 判定 时 已 经 基本 介绍 过 
了 。 之 所 以 说 它 是 最 基础 的 收集 算法 ， 是 因为 后 续 的 收集 算法 都 是 基于 这 种 思路 并 对 其 缺 
点 进行 改进 而 得 到 的 。 它 主要 有 两 个 缺点 : 一 个 是 效率 问题 ， 标 记 和 清除 过 程 的 效率 都 不 
高 ， 另 外 一 个 是 空间 问题 ， 标 记 清 除 之 后 会 产生 大 量 不 连续 的 内 存 碎片 ， 空 间 碎 片 太 多 可 
能 会 导致 ， 当 程序 在 以 后 的 运行 过 程 中 需要 分 配 较 大 对 象 时 无 法 找到 足够 的 连续 内 存 而 不 
得 不 提前 触发 另 一 次 垃圾 收集 动作 。 

标记 -清除 算法 包括 两 个 阶段 : “标记 ”和 “清除 ”。 在 标记 阶段 ， 确 定 所 有 要 
的 对 象 ， 并 做 标记 。 清 除 阶段 紧 随 标 记 阶 段 ， 将 标记 阶段 确定 不 可 用 的 对 象 清除 。 

标记 -清除 算法 是 基础 的 收集 算法 ， 标 记 和 清除 阶段 的 效率 不 高 ， 而 且 清除 后 会 产生 
大 量 的 不 连续 空间 ， 这 样 当 程 序 需要 分 配 大 内 存 对 象 时 ， 可 能 无 法 找到 足够 的 连续 空间 。 

垃圾 回收 前 : 


回 


收 
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TR 丰产 本 > 


和 jadayiznbi 发 


二 = 权衡 优化 、 高 效 和 安全 的 最 优 方 案 


8.7.2 ”复制 算法 


为 了 解决 效率 问题 ， 一 种 称 为 “复制 ”(Copying) 的 收集 算法 出 现 了 ， 它 将 可 用 内 存 按 
容量 划分 为 大 小 相等 的 两 块 ， 每 次 只 使 用 其 中 的 一 块 。 当 这 一 块 的 内 存 用 完了 ， 就 将 还 存 
活着 的 对 象 复制 到 另外 一 块 上 面 ， 然 后 再 把 已 使 用 过 的 内 存 空间 一 次 清理 掉 。 这 样 使 得 每 
次 都 是 对 其 中 的 一 块 进行 内 存 回收 ， 内 存 分 配 时 也 就 不 用 考虑 内 存 碎片 等 复杂 情况 ， 只 要 
移动 堆 顶 指针 ， 按 顺序 分 配 内 存 即 可 ， 实 现 简单 ， 运 行 高 效 。 只 是 这 种 算法 的 代价 是 将 内 
存 缩小 为 原来 的 一 半 ， 未 免 太 高 了 一 点 。 

复制 算法 是 把 内 存 分 成 大 小 相等 的 两 块 ， 每 次 使 用 其 中 一 块 ， 当 垃圾 回收 的 时 候 ， 把 
存活 的 对 象 复制 到 另 一 块 上 ， 然 后 把 这 块 内 存 整个 清理 掉 。 

复制 算法 实现 简单 ， 运 行 效率 高 ， 但 是 由 于 每 次 只 能 使 用 其 中 的 一 半 ， 造 成 内 存 的 利 
用 率 不 高 。 现 在 的 JVM 用 复制 方法 收集 新 生 代 ， 由 于 新 生 代 中 大 部 分 对 象 (98%) 都 是 朝 生 
夕 死 的 ， 所 以 两 块 内 存 的 比例 不 是 1 : 1， 大 概 是 8 : 1。 

垃圾 回收 前 : 


垃圾 回收 后 : 


绿色 : 表示 存活 对 象 ”红色 : 表示 可 回收 对 象 ” 白色: 表示 未 使 用 空间 


现在 的 商业 虚拟 机 都 采用 这 种 收集 算法 来 回收 新 生 代 ，IBM 的 专门 研究 表明 ， 新 生 代 
中 的 对 象 98% 是 朝 生 夕 死 的 ， 所 以 并 不 需要 按照 1 : 1 的 比例 来 划分 内 存 空 间 ， 而 是 将 内 
存 分 为 一 块 较 大 的 Eden 空间 和 两 块 较 小 的 Survivor 空间 ， 每 次 使 用 Eden 和 其 中 的 一 块 
Survivor。 当 回收 时 ， 将 Eden 和 Survivor 中 还 存活 着 的 对 象 一 次 性 地 拷贝 到 另外 一 块 
Survivor 空间 上 ， 最 后 清理 掉 Eden 和 刚才 用 过 的 Survivor 的 空间 。HotSpot 虚拟 机 默认 
Eden 和 Survivor 的 大 小 比例 是 8 : 1， 也 就 是 每 次 新 生 代 中 可 用 内 存 空 间 为 整个 新 生 代 容 
量 的 90%(80%+10%)， 只 有 10% 的 内 存 是 会 被 “浪费 ”的 。 当 然 ，98% 的 对 象 可 回收 只 是 
一 般 场景 下 的 数据 ， 我 们 没有 办 法 保证 每 次 回收 都 只 有 不 多 于 10% 的 对 象 存活 ， 当 
Survivor 空间 不 够 用 时 ， 需 要 依赖 其 他 内 存 ( 这 里 指 老 年 代 ) 进 行 分 配 担保 (Handle 


Promotion)。 
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内 存 的 分 配 担保 就 好 比 我 们 去 银行 借款 ， 如 果 我 们 信誉 很 好 ， 在 98% 的 情况 下 都 能 按 
时 偿还 ， 于 是 银行 可 能 会 默认 我 们 下 一 次 也 能 按时 按 量 地 偿还 贷款 ， 只 需要 有 一 个 担保 人 
能 保证 如 果 我 不 能 还 款 时 ， 可 以 从 他 的 账户 扣 钱 ， 那 银行 就 认为 没有 风险 了 。 内 存 的 分 配 
担保 也 一 样 ， 如 果 另 外 一 块 Survivor 空间 没有 足够 的 空间 存放 上 一 次 新 生 代 收集 下 来 的 存 
活 对 象 ， 这 些 对 象 将 直接 通过 分 配 担保 机 制 进入 老年 代 。 关 于 对 新 生 代 进 行 分 配 担 保 的 内 
容 ， 本 章 稍 后 在 讲解 垃圾 收集 器 执行 规则 时 还 会 再 详细 讲解 。 


8.7.3 ”标记 -整理 算法 


复制 收集 算法 在 对 象 存活 率 较 高 时 就 要 执行 较 多 的 复制 操作 ， 效 率 将 会 变 低 。 更 关键 
的 是 ， 如 果 不 想 浪费 50% 的 空间 ， 就 需要 有 人 额外 的 空间 进行 分 配 担 保 ， 以 应 对 被 使 用 的 内 
存 中 所 有 对 象 都 100% 存 活 的 极端 情况 ， 所 以 在 老年 代 一 般 不 能 直接 选用 这 种 算法 。 

根据 老年 代 的 特点 ， 有 人 提出 了 另外 一 种 标记 -整理 (Mark-Compacb 算 法 ， 标 记过 程 
仍然 与 标记 -清除 算法 一 样 ， 但 后 续 步 又 不 是 直接 对 可 回收 对 象 进行 清理 ， 而 是 让 所 有 存 
活 的 对 象 都 向 一 端 移动 ， 然 后 直接 清理 掉 端 边界 以 外 的 内 存 。 

标记 -整理 算法 和 标记 -清除 算法 一 样 ， 但 是 标记 -整理 算法 不 是 把 存活 对 象 复制 到 另 
一 块 内 存 ， 而 是 把 存活 对 象 往 内 存 的 一 端 移动 ， 然 后 直接 回收 边界 以 外 的 内 存 。 

标记 -整理 算法 提高 了 内 存 的 利用 率 ， 并 且 它 适合 在 收集 对 象 存 活 时 间 较 长 的 老 
年 代 。 

垃圾 回收 前 : 


垃圾 回收 后 : 
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8.7.4 分 代 收 集 算法 

当前 商业 虚拟 机 的 垃圾 收集 都 采用 “分 代 收 集 ”(Generational Collection) 算 法 ， 这 种 算 
法 并 没有 什么 新 的 思想 ， 只 是 根据 对 象 的 存活 周期 的 不 同 将 内 存 划 分 为 几 块 。 一 般 是 把 
Java 堆 分 为 新 生 代 和 老年 代 ， 这 样 就 可 以 根据 各 个 年 代 的 特点 采用 最 适当 的 收集 算法 。 在 
新 生 代 中 ， 每 次 垃圾 收集 时 都 发 现 有 大 批 对 象 死去 ， 只 有 少量 存活 ， 那 就 选用 复制 算法 ， 
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只 需要 付出 少量 存活 对 象 的 复制 成 本 就 可 以 完成 收集 。 而 老年 代 中 因为 对 象 存活 率 高 、 没 
有 额外 空间 对 它 进 行 分 配 担保 ， 就 必须 使 用 标记 -清理 或 标记 -整理 算法 来 进行 回收 。 

分 代 收 集 是 根据 对 象 的 存活 时 间 把 内 存 分 为 新 生 代 和 老年 代 ， 根 据 个 代 对 象 的 存活 特 
点 ， 每 个 代 采 用 不 同 的 垃圾 回收 算法 。 新 生 代 采 用 标记 -复制 算法 ， 老 年 代 采 用 标记 -整理 
算法 。 


8.8 垃圾 收集 器 


如 果 说 收集 算法 是 内 存 回收 的 方法 论 ， 垃 圾 收集 器 就 是 内 存 回收 的 具体 实现 。Java 虚 
拟 机 规范 中 对 垃圾 收集 器 应 该 如 何 实现 并 没有 任何 规定 ， 因 此 不 同 的 厂商 、 不 同 版 本 的 虚 
拟 机 所 提供 的 垃圾 收集 器 都 可 能 会 有 很 大 的 差别 ， 并 且 一 般 都 会 提供 参数 供用 户 根据 自己 
的 应 用 特点 和 要 求 组 合 出 各 个 年 代 所 使 用 的 收集 器 。 这 里 讨论 的 收集 器 基于 Sun HotSpot 
虚拟 机 1.6 版 Update 22， 这 个 虚拟 机 包含 的 所 有 收集 器 如 图 8-11 所 示 。 
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图 8-11 HotSpot JVM1.6 的 垃圾 收集 器 


图 8-11 展示 了 7 种 作用 于 不 同 分 代 的 收集 器 (包括 JDK 1.6 Updatel4 后 引入 的 Early 
Access 版 G1 收集 器 )， 如 果 两 个 收集 器 之 间 存 在 连 线 ， 就 说 明 它 们 可 以 搭配 使 用 。 

在 介绍 这 些 收集 器 各 自 的 特性 之 前 ， 我 们 先 来 明确 一 个 观点 : 虽然 我 们 是 在 对 各 个 收 
集 器 进行 比较 ， 但 并 非 为 了 挑选 一 个 最 好 的 收集 器 出 来 。 因 为 直到 现在 为 止 还 没有 最 好 的 
收集 器 出 现 ， 更 加 没有 万 能 的 收集 器 ， 所 以 我 们 选择 的 只 是 对 具体 应 用 最 合适 的 收集 器 。 
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这 点 不 需要 多 加 解释 就 能 证 明 : 如 果 有 一 种 放 之 四 海 皆 准 、 任 何 场景 下 都 适用 的 完美 收集 
器 存在 ， 那 HotSpot 虚拟 机 就 没 必要 实现 那么 多 不 同 的 收集 器 了 。 


8.8.1 ”Serial 收集 器 


Serial 收集 器 是 最 基本 、 历 史 最 悠久 的 收集 器 ， 曾 经 (在 JDK 1.3.1 之 前 ) 是 虚拟 机 新 生 
代 收 集 的 唯一 选择 。 大 家 看 名 字 就 知道 ， 这 个 收集 器 是 一 个 单线 程 的 收集 器 ， 但 它 的 “ 单 
线程 ”的 意义 并 不 仅仅 是 说 明 它 只 会 使 用 一 个 CPU 或 一 条 收集 线程 去 完成 垃圾 收集 工 
作 ， 更 重要 的 是 在 它 进行 垃圾 收集 时 ， 必 须 暂 停 其 他 所 有 的 工作 线程 (Sun 将 这 件 事情 称 之 
为 “Stop The World”)， 直 到 它 收集 结束 。“Stop The World” 这 个 名 字 也 许 听 起 来 很 酷 ， 
但 这 项 工作 实际 上 是 由 虚拟 机 在 后 台 自 动 发 起 和 自动 完成 的 ， 在 用 户 不 可 见 的 情况 下 把 用 
户 的 正常 工作 的 线程 全 部 停 掉 ， 这 对 很 多 应 用 来 说 都 是 难以 接受 的 。 你 想 想 ， 要 是 你 的 电 
脑 每 运行 一 个 小 时 就 会 暂停 响应 5 分 钟 ， 你 会 有 什么 样 的 心情 。 

对 于 “Stop The World” 带 给 用 户 的 恶劣 体验 ， 虚 拟 机 的 设计 者 们 表示 完全 理解 ， 但 
也 表示 非常 委 届 : “你 妈妈 在 给 你 打扫 房间 的 时 候 ， 肯 定 也 会 让 你 老 老实 实地 在 椅子 上 或 
房间 外 待 着 ， 如 果 她 一 边 打 扫 ， 你 一 边 乱 扔 纸 属 ， 这 房间 还 能 打扫 完 吗 ? ”这 确实 是 一 个 
合情合理 的 矛盾 ， 虽 然 垃圾 收集 这 项 工作 听 起 来 和 打扫 房间 属于 一 个 性 质 的 ， 但 实际 上 肯 
定 还 要 比 打 扫 房 间 复杂 得 多 啊 ! 

从 JDK 1.3 开始 ， 一 直到 现在 还 没 正 式 发 布 的 JDK 1.7，HotSpot 虚拟 机 开发 团队 为 消 
除 或 减少 工作 线程 因 内 存 回收 而 导致 停顿 的 努力 一 直 在 进行 着 ， 从 Serial 收集 器 到 Parallel 
收集 器 ， 再 到 Concurrent Mark Sweep(CMS) 现 在 还 未 正式 发 布 的 Garbage First(G1) 收 集 
器 ， 我 们 看 到 了 一 个 个 越 来 越 优秀 (也 越 来 越 复 杂 ) 的 收集 器 的 出 现 ， 用 户 线程 的 停顿 时 间 
在 不 断 缩短 ， 但 是 仍然 没有 办 法 完全 消除 (这 里 暂 不 包括 RTSJ 中 的 收集 器 )。 寻 找 更 优秀 的 
垃圾 收集 器 的 工作 仍 在 继续 ! 

写 到 这 里 ， 笔 者 似乎 已 经 把 Serial 收集 器 描述 成 一 个 老 而 无 用 ， 食 之 无 味 弃 之 可 惜 的 
鸡肋 了 ， 但 实际 上 到 现在 为 止 ， 它 依然 是 虚拟 机 运行 在 Client 模式 下 的 默认 新 生 代 收 集 
器 。 它 也 有 着 优 于 其 他 收集 器 的 地 方 : 简单 而 高 效 (与 其 他 收集 器 的 单线 程 比 )。 对 于 限定 
单个 CPU 的 环境 来 说 ，Serial 收集 器 由 于 没有 线程 交互 的 开销 ， 专 心 做 垃圾 收集 自然 可 以 
获得 最 高 的 单线 程 收集 效率 。 在 用 户 的 桌面 应 用 场景 中 ， 分 配给 虚拟 机 管理 的 内 存 一 般 来 
说 不 会 很 大 ， 收 集 几 十 兆 甚至 一 两 百 兆 的 新 生 代 (仅仅 是 新 生 代 使 用 的 内 存 ， 桌 面 应 用 基本 
上 不 会 再 大 了 )， 停 顿时 间 完 全 可 以 控制 在 几 十 毫秒 最 多 一 百 多 毫秒 以 内 ， 只 要 不 是 频繁 发 
生 ， 这 点 停顿 是 可 以 接受 的 。 所 以 ，Serial 收集 器 对 于 运行 在 Client 模式 下 的 虚拟 机 来 说 
是 一 个 很 好 的 选择 。 


8.8.2 ParNew 收集 器 


ParNew 收集 器 其 实 就 是 Serial 收集 器 的 多 线程 版 本 ， 除 了 使 用 多 条 线程 进行 垃圾 收 
集 之 外 ， 其 余 行为 包括 Serial 收集 器 可 用 的 所 有 控制 参数 (例如 : -XX:SurvivorRatio、 
-XX:PretenureSizeThreshold 、 -XX:HandlePromotionFailure 等 )、 收 集 算法 、Stop The 
World、 对 象 分 配 规 则 、 回 收 策略 等 都 与 Serial 收集 器 完全 一 样 ， 实 现 上 这 两 种 收集 器 也 共 
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用 了 相当 多 的 代码 。 

ParNew 收集 器 除了 多 线程 收集 之 外 ， 其 他 与 Serial 收集 器 相 比 并 没有 太 多 创新 之 处 ， 
但 它 却 是 许多 运行 在 Server 模式 下 的 虚拟 机 中 首选 的 新 生 代 收集 器 。 其 中 有 一 个 与 性 能 无 
关 但 很 重要 的 原因 是 ， 除 了 Serial 收集 器 外 ， 目 前 只 有 它 能 与 CMS 收集 器 配合 工作 。 在 
JDK 1.5 时 期 ，HotSpot 推出 了 一 款 在 强 交 互 应 用 中 几乎 可 称 为 有 划时代 意义 的 垃圾 收集 器 
一 一 CMS 收集 器 ， 这 款 收集 器 是 HotSpot 虚拟 机 中 第 一 款 真正 意义 上 的 并 发 (Concurrent) 收 
集 器 ， 它 第 一 次 实现 了 让 垃圾 收集 线程 与 用 户 线程 (基本 上 ) 同 时 工作 ， 用 前 面 那个 例子 的 
话 来 说 ， 就 是 做 到 了 在 你 妈妈 打扫 房间 的 时 候 你 还 能 同时 往 地 上 扔 纸 履 。 

不 幸 的 是 ， 它 作为 老年 代 的 收集 器 ， 却 无 法 与 JDK 1.4.0 中 已 经 存在 的 新 生 代 收 集 器 
Parallel Scavenge 配合 工作 ， 所 以 在 JDK 1.5 中 使 用 CMS 来 收集 老年 代 的 时 候 ， 新 生 代 只 
能 选择 ParNew 或 Serial 收集 器 中 的 一 个 。ParNew 收集 器 也 是 使 用 -XX: 
+UseConcMarkSweepGC 选项 后 的 默认 新 生 代 收 集 器 ， 也 可 以 使 用 -XX:+UseParNewGC 选 
项 来 强制 指定 它 。 

ParNew 收集 器 在 单 CPU 的 环境 中 绝对 不 会 有 比 Serial 收集 器 更 好 的 效果 ， 甚 至 由 于 
存在 线程 交互 的 开销 ， 该 收集 器 在 通过 超 线程 技术 实现 的 两 个 CPU 的 环境 中 都 不 能 百 分 
之 百 地 保证 能 超越 Serial 收集 器 。 当 然 ， 随 着 可 以 使 用 的 CPU 的 数量 的 增加 ， 它 对 于 GC 
时 系统 资源 的 利用 还 是 很 有 好 处 的 。 它 默认 开启 的 收集 线程 数 与 CPU 的 数量 相同 ， 在 
CPU 非常 多 (譬如 32 个 ， 现 在 CPU 动 辆 就 4 核 加 超 线程 ， 服 务 器 超过 32 个 逻辑 CPU 的 情 
况 越 来 越 多 了 ) 的 环境 下 ， 可 以 使 用 -XX:ParallelGCThreads 参数 来 限制 垃圾 收集 的 线程 数 。 

注意 : 从 ParNew 收集 器 开始 ， 后 面 还 将 会 接触 到 几 款 并 发 和 并 行 的 收集 器 。 在 大 家 
可 能 产生 疑惑 之 前 ， 有 必要 先 解释 两 个 名 词 : 并 发 和 并 行 。 这 两 个 名 词 都 是 并 发 编程 中 的 
概念 ， 在 谈论 垃圾 收集 器 的 上 下 文 语 境 中 ， 他 们 可 以 解释 为 : 

口 并行 (Parallel): 指 多 条 垃圾 收集 线程 并 行 工作 ， 但 此 时 用 户 线程 仍然 处 于 等 待 

状态 。 

口 ”并 发 (Concurrent): 指 用 户 线程 与 垃圾 收集 线程 同时 执行 (但 不 一 定 是 并 行 的 ， 可 

能 会 交 蔡 执行 )， 用 户 程序 继续 运行 ， 而 垃圾 收集 程序 运行 于 另 一 个 CPU 上 。 


8.8.3 Parallel Scavenge 收集 器 


Parallel Scavenge 收集 器 也 是 一 个 新 生 代 收 集 器 ， 它 也 是 使 用 复制 算法 的 收集 器 ， 又 是 
并 行 的 多 线程 收集 器 …… 看 上 去 和 ParNew 都 一 样 ， 那 它 有 什么 特别 之 处 呢 ? 

Parallel Scavenge 收集 器 的 特点 是 它 的 关注 点 与 其 他 收集 器 不 同 ，CMS 等 收集 器 的 关 
注 点 尽 可 能 地 缩短 垃圾 收集 时 用 户 线程 的 停顿 时 间 ， 而 Parallel Scavenge 收集 器 的 目标 则 
是 达到 一 个 可 控制 的 吞吐 量 (Throughpub)。 所 谓 吞 吐 量 就 是 CPU 用 于 运行 用 户 代码 的 时 间 
与 CPU 总 消耗 时 间 的 比值 ， 即 吞吐 量 = 运行 用 户 代码 时 间 /( 运 行 用 户 代码 时 间 + 垃圾 
收集 时 间 )， 虚 拟 机 总 共 运 行 了 100 分 钟 ， 其 中 垃圾 收集 花 掉 1 分 钟 ， 那 吞吐 量 就 是 99%。 

停顿 时 间 越 短 就 越 适 合 需要 与 用 户 交互 的 程序 ， 良 好 的 响应 速度 能 提升 用 户 的 体验 ; 
而 高 吞吐 量 则 可 以 最 高 效率 地 利用 CPU 时 间 ， 尽 快 地 完成 程序 的 运算 任务 ， 主 要 适合 在 
后 台 运 算 而 不 需要 太 多 交互 的 任务 。 
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第 8 章 内存 异常 和 垃圾 处 理 


Parallel Scavenge 收集 器 提供 了 两 个 参数 用 于 精确 控制 吞吐 量 ， 分 别 是 控制 最 大 垃圾 收 
集 停顿 时 间 的 -XX:MaxGCPauseMillis 参数 及 直接 设置 吞吐 量 大 小 的 -XX:GCTimeRatio 
参数 。 

MaxGCPauseMillis 参数 允许 的 值 是 一 个 大 于 0 的 毫秒 数 ， 收 集 器 将 尽力 保证 内 存 回收 
花费 的 时 间 不 超过 设 定 值 。 不 过 大 家 不 要 异想天开 地 认为 如 果 把 这 个 参数 的 值 设置 得 稍 小 
一 点 就 能 使 得 系统 的 垃圾 收集 速度 变 得 更 快 ，GC 停顿 时 间 缩 短 是 以 牺牲 吞吐 量 和 新 生 代 
空间 来 换取 的 : 系统 把 新 生 代 调 小 一 些 ， 收 集 300MB 新 生 代 肯 定 比 收集 S00MB 快 吧 ， 这 
也 直接 导致 垃圾 收集 发 生得 更 频繁 一 些 ， 原 来 10 秒 收集 一 次 、 每 次 停顿 100 毫秒 ， 现 在 
变 成 5 秒 收集 一 次 、 每 次 停顿 70 毫秒 。 停 顿时 间 的 确 在 下 降 ， 但 吞吐 量 也 降下 来 了 。 

GCTimeRatio 参数 的 值 应 当 是 一 个 大 于 0 小 于 100 的 整数 ， 也 就 是 垃圾 收集 时 间 占 总 
时 间 的 比率 ， 相 当 于 是 吞吐 量 的 倒数 。 如 果 把 此 参数 设置 为 19， 那 允许 的 最 大 GC 时 间 就 
占 总 时 间 的 5%( 即 1 /1+19))， 默 认 值 为 99， 就 是 允许 最 大 1%( 即 1/(1+99)) 的 垃圾 收集 
时 间 。 

由 于 与 吞吐 量 关 系 密切 ，Parallel Scavenge 收集 器 也 经 常 被 称 为 “吞吐 量 优先 ” 收 
集 器 。 除 上 述 两 个 参数 之 外 ，Parallel Scavenge 收集 器 还 有 一 个 参数 -XX: 
+UseAdaptiveSizePolicy 值得 关注 。 这 是 一 个 开关 参数 ， 当 这 个 参数 打开 之 后 ， 就 不 需要 手 
工 指 定 新 生 代 的 大 小 (-Xmn)、Eden 与 Survivor 区 的 比例 CXX:SurvivorRatio)、 晋 升 老年 代 
对 象 年 龄 (-XX:PretenureSizeThreshold) 等 细节 参数 了 ， 虚 拟 机 会 根据 当前 系统 的 运行 情况 收 
集 性 能 监控 信息 ， 动 态 调整 这 些 参数 以 提供 最 合适 的 停顿 时 间或 最 大 的 吞吐 量 ， 这 种 调节 
方式 称 为 GC 自 适 应 的 调节 策略 (GC Ergonomics)。 如 果 读 者 对 于 收集 器 运作 原理 不 太 了 
解 ， 手 工 优化 存在 困难 的 时 候 ， 使 用 Parallel Scavenge 收集 器 配合 自 适 应 调节 策略 ， 把 内 
存 管理 的 调 优 任务 交 给 虚拟 机 去 完成 将 是 一 个 很 不 错 的 选择 。 只 需要 把 基本 的 内 存 数据 设 
置 好 (如 -Xmx 设置 最 大 堆 )， 然 后 使 用 MaxGCPauseMillis 参数 (更 关注 最 大 停顿 时 间 ) 或 
GCTimeRatio 参数 (更 关注 吞吐 量 ) 给 虚拟 机 设立 一 个 优化 目标 ， 那 具体 细节 参数 的 调节 工 
作 就 由 虚拟 机 完成 了 。 自 适应 调节 策略 也 是 Parallel Scavenge 收集 器 与 ParNew 收集 器 的 一 
个 重要 区 别 。 


8.8.4 ”Serial Old 收集 器 


Serial Old 是 Serial 收集 器 的 老年 代 版 本 ， 它 同样 是 一 个 单线 程 收 集 器 ， 使 用 标记 - 整 
理 算法 。 这 个 收集 器 的 主要 意义 也 是 被 Client 模式 下 的 虚拟 机 使 用 。 如 果 在 Server 模式 
下 ， 它 主要 还 有 两 大 用 途 : 一 个 是 在 JDK 1.5 及 之 前 的 版 本 中 与 Parallel Scavenge 收集 器 
搭配 使 用 ， 另 外 一 个 就 是 作为 CMS 收集 器 的 后 备 预案 ， 在 并 发 收集 发 生 Concurrent Mode 
Failure 的 时 候 使 用 。 


8.8.5 ”Parallel Old 收集 器 


Parallel Old 是 Parallel Scavenge 收集 器 的 老年 代 版 本 ， 使 用 多 线程 和 标记 -整理 算法 。 
这 个 收集 器 是 在 JDK 1.6 中 才 开 始 提供 的 ， 在 此 之 前 ， 新 生 代 的 Parallel Scavenge 收集 器 
一 直 处 于 比较 尴 爷 的 状态 。 原 因 是 ， 如 果 新 生 代 选择 了 Parallel Scavenge 收集 器 ， 老 年 代 
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除了 Serial Old(PS MarkSweep) 收 集 器 外 别 无 选择 (还 记得 上 面 说 过 Parallel Scavenge 收集 器 
无 法 与 CMS 收集 器 配合 工作 吗 )。 由 于 单线 程 的 老年 代 Serial Old 收集 器 在 服务 端 应 用 性 
能 上 的 “拖累 ”， 即 便 使 用 了 Parallel Scavenge 收集 器 也 未 必 能 在 整体 应 用 上 获得 吞吐 量 
最 大 化 的 效果 ， 又 因为 老年 代 收 集中 无 法 充分 利用 服务 器 多 CPU 的 处 理 能 力 ， 在 老年 代 
很 大 而 且 硬件 比较 高 级 的 环境 中 ， 这 种 组 合 的 吞吐 量 甚至 还 不 一 定 有 ParNew 加 CMS 的 组 
合 “ 给 力 ”。 

直到 Parallel Old 收集 器 出 现 后 ，“ 吞 吐 量 优先 ”收集 器 终于 有 了 比较 名 副 其 实 的 应 用 
组 合 ， 在 注重 吞吐 量 及 CPU 资源 敏感 的 场合 ， 都 可 以 优先 考虑 Parallel Scavenge 加 Parallel 
Old 收集 器 。 


8.8.6 CMS 收集 器 


CMS(Concurrent Mark Sweep) 收 集 器 是 一 种 以 获取 最 短 回收 停顿 时 间 为 目标 的 收集 
器 。 目 前 很 大 一 部 分 的 Java 应 用 都 集中 在 互联 网 站 或 B/S 系统 的 服务 端 上 ， 这 类 应 用 尤其 
重视 服务 的 响应 速度 ， 希 望 系统 停顿 时 间 最 短 ， 以 给 用 户 带 来 较 好 的 体验 。CMS 收集 器 就 
非常 符合 这 类 应 用 的 需求 。 

从 名 字 ( 包 含 “Mark Sweep”) 上 就 可 以 看 出 CMS 收集 器 是 基于 标记 -清除 算法 实现 
的 ， 它 的 运作 过 程 相对 于 前 面 几 种 收集 器 来 说 要 更 复杂 一 些 ， 整 个 过 程 分 为 4 个 步骤 ， 
包括 : 


初始 标记 (CMS initial mark)。 
并 发 标记 (CMS concurrent mark) 。 
重新 标记 (CMS remark)。 

口 “ 并 发 清除 (CMS concurrent sweep)。 

其 中 初始 标记 、 重 新 标记 这 两 个 步骤 仍然 需要 “Stop The World”。 初 始 标记 仅仅 只 
是 标记 一 下 GC Roots 能 直接 关联 到 的 对 象 ， 速 度 很 快 ， 并 发 标记 阶段 就 是 进行 GC Roots 
Tracing 的 过 程 ， 而 重新 标记 阶段 则 是 为 了 修正 并 发 标记 期 间 ， 因 用 户 程序 继续 运作 而 导致 
标记 产生 变动 的 那 一 部 分 对 象 的 标记 记录 ， 这 个 阶段 的 停顿 时 间 一 般 会 比 初始 标记 阶段 稍 

一 些 ， 但 远 比 并 发 标记 的 时 间 短 。 

由 于 整个 过 程 中 耗 时 最 长 的 并 发 标记 和 并 发 清除 过 程 中 ， 收 集 器 线程 都 可 以 与 用 户 线 
程 一 起 工作 ， 所 以 总 体 上 来 说 ，CMS 收集 器 的 内 存 回收 过 程 是 与 用 户 线程 一 起 并 发 地 执 
行 的 。 

CMS 是 一 款 优秀 的 收集 器 ， 它 的 最 主要 优点 在 名 字 上 已 经 体现 出 来 了 : 并 发 收集 、 低 
停顿 ，Sun 的 一 些 官方 文档 里 面 也 称 之 为 并 发 低 停顿 收集 器 (Concurrent Low Pause 
Collector)。 但 是 CMS 还 远 达 不 到 完美 的 程度 ， 它 有 以 下 三 个 显著 的 缺点 。 

(1) CMS 收集 器 对 CPU 资源 非常 敏感 。 其 实 ， 面 向 并 发 设计 的 程序 都 对 CPU 资源 比 
较 敏 感 。 在 并 发 阶段 ， 它 虽然 不 会 导致 用 户 线程 停顿 ， 但 是 会 因为 占用 了 一 部 分 线程 (或 者 
说 CPU 资源 ) 而 导致 应 用 程序 变 慢 ， 总 吞吐 量 会 降低 。CMS 默认 启动 的 回收 线程 数 是 (CPU 
数量 +13)4， 也 就 是 当 CPU 在 4 个 以 上 时 ， 并 发 回收 时 垃圾 收集 线程 最 多 占用 不 超过 25% 
的 CPU 资源 。 但 是 当 CPU 不 足 4 个 时 (譬如 2 个 )， 那 么 CMS 对 用 户 程序 的 影响 就 可 能 变 
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得 很 大 ， 如 果 CPU 负载 本 来 就 比较 大 的 时 候 ， 还 分 出 一 半 的 运算 能 力 去 执行 收集 器 线 
程 ， 就 可 能 导致 用 户 程序 的 执行 速度 忽然 降低 了 50%， 这 也 很 让 人 受 不 了 。 为 了 解决 这 种 
情况 ， 虚 拟 机 提供 了 一 种 称 为 “ 增 量 式 并 发 收集 器 ”(Incremental Concurrent Mark Sweep/i- 
CMS) 的 CMS 收集 器 变种 ， 所 做 的 事情 和 单 CPU 年 代 PC 机 操作 系统 使 用 抢占 式 来 模拟 多 
任务 机 制 的 思想 一 样 ， 就 是 在 并 发 标记 和 并 发 清理 的 时 候 让 GC 线程 、 用 户 线程 交替 运 
行 ， 尽 量 减 少 GC 线程 的 独占 资源 的 时 间 ， 这 样 整个 垃圾 收集 的 过 程 会 更 长 ， 但 对 用 户 程 
序 的 影响 就 会 显得 少 一 些 ， 速 度 下 降 也 就 没有 那么 明显 ， 但 是 目前 版 本 中 ，i-CMS 已 经 被 
声明 为 “deprecated”， 即 不 再 提倡 用 户 使 用 。 

(2) CMS 收集 器 无 法 处 理 浮动 垃圾 (Floating Garbage)， 可 能 出 现 “Concurrent Mode 
Failure ”失败 而 导致 男 一 次 Full GC 的 产生 。 由 于 CMS 并 发 清理 阶段 用 户 线程 还 在 运行 
着 ， 伴 随 程序 的 运行 自然 还 会 有 新 的 垃圾 不 断 产生 ， 这 一 部 分 垃圾 出 现在 标记 过 程 之 
后 ，CMS 无 法 在 本 次 收集 中 处 理 掉 它 们 ， 只 好 留待 下 一 次 GC 时 再 将 其 清理 掉 。 这 一 部 
分 垃圾 就 称 为 “浮动 垃圾 ”。 也 是 由 于 在 垃圾 收集 阶段 用 户 线程 还 需要 运行 ， 即 还 需要 
预 留 足够 的 内 存 空间 给 用 户 线程 使 用 ， 因 此 CMS 收集 器 不 能 像 其 他 收集 器 那样 等 到 老 
年 代 几 乎 完全 被 填 满 了 再 进行 收集 ， 需 要 预 留 一 部 分 空间 提供 并 发 收集 时 的 程序 运作 
使 用 。 在 默认 设置 下 ，CMS 收集 器 在 老年 代 使 用 了 68% 的 空间 后 就 会 被 激活 ， 这 是 一 
个 偏 保守 的 设置 ， 如 果 在 应 用 中 老年 代 增 长 不 是 太 快 ， 可 以 适当 调 高 参数 -XX: 
CMSInitiatingOccupancyFraction 的 值 来 提高 触发 百分比 ， 以 便 降 低 内 存 回收 次 数 以 获取 更 
好 的 性 能 。 要 是 CMS 运行 期 间 预 留 的 内 存 无 法 满足 程序 需要 ， 就 会 出 现 一 次 
“Concurrent Mode Failure” 失 败 ， 这 时 候 虚 拟 机 将 启动 后 备 预 案 ， 临时 启用 Serial Old 收 
集 器 来 重新 进行 老年 代 的 垃圾 收集 ， 这 样 停顿 时 间 就 很 长 了 。 所 以 说 参数 -XX: 
CMSInitiatingOccupancyFraction 设置 得 太 高 将 会 很 容易 导致 大 量 Concurrent Mode Failure 
失败 ， 性 能 反而 降低 。 

(3) 还 有 最 后 一 个 缺点 ， 在 本 节 在 开头 说 过 ，CMS 是 一 款 基于 标记 -清除 算法 实现 的 
收集 器 ， 如 果 读 者 对 前 面 这 种 算法 介绍 还 有 印象 的 话 ， 就 可 能 想到 这 意味 着 收集 结束 
时 会 产生 大 量 空间 碎片 。 空 间 碎片 过 多 时 ， 将 会 给 大 对 象 分 配 带 来 很 大 的 麻烦 ， 往 往 
会 出 现 老 年 代 还 有 很 大 的 空间 剩余 ， 但 是 无 法 找到 足够 大 的 连续 空间 来 分 配 当 前 
对 象 ， 不 得 不 提前 触发 一 次 Full GC。 为 了 解决 这 个 问题 ，CMS 收集 器 提供 了 一 个 
-XX:+UseCMSCompactAtFullCollection 开关 参数 ， 用 于 在 “享受 ” 完 Full GC 服务 之 后 额外 
免费 附送 一 个 碎片 整理 过 程 ， 内 存 整理 的 过 程 是 无 法 并 发 的 。 空 间 碎片 问题 没有 了 ， 但 停顿 时 
间 不 得 不 变 长 了 。 虚 拟 机 设计 者 还 提供 了 另外 一 个 参数 -XX:CMSFullGCsBeforeCompaction， 
这 个 参数 用 于 设置 在 执行 多 少 次 不 压缩 的 Full GC 后 ， 跟 着 来 一 次 带 压 缩 的 。 


8.8.7 ”G1 收集 器 


G1(Garbage First) 收 集 器 是 当前 收集 器 技术 发 展 的 最 前 沿 成 果 ， 在 JDK 1.6_Update14 
中 提供 了 Early Access 版 本 的 G1 收集 器 以 供 试 用 。 在 将 来 DK 1.7 正式 发 布 的 时 候 ，G1 
收集 器 很 可 能 会 有 一 个 成 熟 的 商用 版 本 随 之 发 布 。 这 里 只 对 G1 收集 器 进行 简单 介绍 。 

G1 收集 器 是 垃圾 收集 器 理论 进一步 发 展 的 产物 ， 它 与 前 面 的 CMS 收集 器 相 比 有 两 个 
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显著 的 改进 : 一 是 G1 收集 器 是 基于 标记 -整理 算法 实现 的 收集 器 ， 也 就 是 说 它 不 会 产生 空 
间 碎 片 ， 这 对 于 长 时 间 运 行 的 应 用 系统 来 说 非常 重要 。 二 是 它 可 以 非常 精确 地 控制 停顿 ， 
既 能 让 使 用 者 明确 指定 在 一 个 长 度 为 M 毫秒 的 时 间 片 段 内 ， 消 耗 在 垃圾 收集 上 的 时 间 不 得 
超过 N 毫秒 ， 这 几乎 已 经 是 实时 Java(RTSJ) 的 垃圾 收集 器 的 特征 了 。 

G1 收集 器 可 以 实现 在 基本 不 牺牲 吞吐 量 的 前 提 下 完成 低 停顿 的 内 存 回收 ， 这 是 由 于 
它 能 够 极力 地 避免 全 区 域 的 垃圾 收集 ， 之 前 的 收集 器 进行 收集 的 范围 都 是 整个 新 生 代 或 老 
年 代 ， 而 G1 将 整个 Java 堆 ( 包 括 新 生 代 、 老 年 代 ) 划 分 为 多 个 大 小 固定 的 独立 区 域 


(Region)， 并 且 跟 踪 这 些 


区 域 里 面 的 垃圾 堆积 程度 ， 在 后 台 维护 一 个 优先 列表 ， 每 次 根据 


允许 的 收集 时 间 ， 优 先 回收 垃圾 最 多 的 区 域 (这 就 是 Garbage First 名 称 的 来 由 )。 区 域 划分 
及 有 优先 级 的 区 域 回 收 ， 保 证 了 G1 收集 器 在 有 限 的 时 间 内 可 以 获得 最 高 的 收集 效率 。 
8.8.8 垃圾 收集 器 参数 总 结 


JDK 1.6 中 的 各 种 垃圾 收集 器 到 此 已 全 部 介绍 完毕 ， 在 描述 过 程 中 提 到 了 很 多 虚拟 机 
非 稳定 的 运行 参数 ， 表 8-1 整理 了 这 些 参数 以 供 读者 实践 时 参考 。 


参 数 
UseSerialGC 


UseParNewGC 


UseConcMarkSweepGC 


UseParallelGC 


UseParallelOldGC 


表 8-1 垃圾 收集 相关 的 常用 参数 


描 述 
虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Serial +Serial 
Old 的 收集 器 组 合 进行 内 存 回 收 
打开 此 开关 后 ， 使 用 ParNew + Serial Old 的 收集 器 组 合 进行 内 存 回 收 
打开 此 开关 后 ， 使 用 ParNew + CMS + Serial Old 的 收集 器 组 合 进行 内 存 
回收 。Serial Old 收集 器 将 作为 CMS 收集 器 出 现 Concurrent Mode Failure 
失败 后 的 后 备 收集 器 使 用 
虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Parallel 
Scavenge + Serial Old(PS MarkSweep) 的 收集 器 组 合 进行 内 存 回 收 
打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel Old 的 收集 器 组 合 进行 内 
存 回收 


SurvivorRatio 


新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 ， 默认 为 8， 代表 


Eden : Survivor=8 : 1 


PretenureSizeThreshold 


MaxTenuringThreshold 


直接 晋升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 大 于 这 个 参数 的 对 象 将 
直接 在 老年 代 分 配 

晋升 到 老年 代 的 对 象 年 龄 。 每 个 对 象 在 坚持 过 一 次 Minor GC 之 后 ,年 龄 
就 加 1， 当 超过 这 个 参数 值 时 就 进入 老年 代 


UseAdaptiveSizePolic 


HandlePromotionFailure 


动态 调整 Java 堆 中 各 个 区 域 的 大 小 以 及 进入 老年 代 的 年 龄 
是 否 允 许 分 配 担保 失败 ， 即 老年 代 的 剩余 空间 不 足以 应 付 新 生 代 的 整个 
Eden 和 Survivor 区 的 所 有 对 象 都 存活 的 极端 情况 


ParallelGCThreads 


设置 并 行 GC 时 进行 内 存 回收 的 线程 数 
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续 表 
参 数 描 述 
pA GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 的 GC 时 间 。 仅 在 
使 用 Parallel Scavenge 收集 器 时 生效 
MaxGCPauseMillis 设置 GC 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 


设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 垃圾 收集 。 默 认 值 为 
68%， 仅 在 使 用 CMS 收集 器 时 生效 

设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 次 内 存 碎 片 整理 。 仅 在 
使 用 CMS 收集 器 时 生效 

设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 一 次 内 存 碎片 整理 。 仅 
在 使 用 CMS 收集 器 时 生效 


CMSInitiatingOccupancy 
Fraction 
UseCMSCompactAtFull 
Collection 
CMSFullGCsBeforeCom 


action 


8.9 内 存 分 配 与 回收 策略 


Java 技术 体系 中 所 提倡 的 自动 内 存 管理 最 终 可 以 归结 为 自动 化 地 解决 了 两 个 问题 : 给 
对 象 分 配 内 存 和 回收 分 配给 对 象 的 内 存 。 关 于 回收 内 存 这 一 点 ， 我 们 已 经 使 用 了 大 量 的 篇 
幅 去 介绍 虚拟 机 中 的 垃圾 收集 器 体系 及 其 运作 原理 ， 现 在 我 们 再 一 起 来 探讨 一 下 给 对 象 分 
配 内存 的 那 点 事 儿 。 

对 象 的 内 存 分 配 ， 往 大 方向 上 讲 ， 就 是 在 堆 上 分 配 (但 也 可 能 经 过 JIT 编译 后 被 拆散 为 
标量 类 型 并 间接 地 在 栈 上 分 配 )， 对 象 主要 分 配 在 新 生 代 的 Eden 区 上 ， 如 果 启 动 了 本 地 线 
程 分 配 缓冲 ， 将 按 线程 优先 在 TLAB 上 分 配 。 少 数 情况 下 也 可 能 会 直接 分 配 在 老年 代 中 ， 
分 配 的 规则 并 不 是 百分之百 固定 的 ， 其 细节 取决 于 当前 使 用 的 是 哪 一 种 垃圾 收集 器 组 合 ， 
还 有 虚拟 机 中 与 内 存 相关 的 参数 的 设置 。 

接 下 来 我 们 将 会 讲解 几 条 最 普遍 的 内 存 分 配 规则 ， 并 通过 代码 去 验证 这 些 规 则 。 本 节 
中 的 代码 在 测试 时 使 用 Client 模式 虚拟 机 运行 ， 没 有 手工 指定 收集 器 组 合 ， 换 句 话 说 ， 验 
证 的 是 使 用 Serial/Serial Old 收集 器 下 (ParNew/Serial Old 收集 器 组 合 的 规则 也 基本 一 致 ) 的 
内 存 分 配 和 回收 的 策略 。 读 者 不 妨 根 据 自 己 项 目 中 使 用 的 收集 器 写 一 些 程序 去 验证 一 下 使 
用 其 他 几 种 收集 器 的 内 存 分 配 策 略 。 


8.9.1 对象 优 先 在 Eden 分 配 


大 多 数 情况 下 ， 对 象 在 新 生 代 Eden 区 中 分 配 。 当 Eden 区 没有 足够 的 空间 进行 分 配 
时 ， 虚 拟 机 将 发 起 一 次 Minor GC。 

虚拟 机 提供 了 -XX:+PrintGCDetails 这 个 收集 器 日 志 参 数 ， 告 诉 虚拟 机 在 发 生 垃 圾 收集 
行为 时 打印 内 存 回 收 日 志 ， 并 且 在 进程 退出 的 时 候 输出 当前 内 存 各 区 域 的 分 配 情况 。 在 
实际 应 用 中 ， 内 存 回收 日 志 一 般 是 打印 到 文件 后 通过 日 志 工 具 进 行 分 析 ， 不 过 本 实验 的 日 
志 并 不 多 ， 直 接 阅 读 就 能 看 得 很 清楚 。 
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代码 清单 8-3 的 testAllocation() 方 法 中 ， 尝 试 分 配 3 个 2MB 大 小 和 1 个 4MB 大 小 
的 对 象 ， 在 运行 时 通过 -Xms20M、-Xmx20M 和 -Xmn10M 这 3 个 参数 限制 Java 堆 大 
小 为 20MB， 且 不 可 扩展 ， 其 中 10MB 分 配给 新 生 代 ， 剩 下 的 10MB 分 配给 老年 代 。 
-XX:SurvivorRatio=8 决定 了 新 生 代 中 Eden 区 与 一 个 Survivor 区 的 空间 比例 是 8 比 1， 从 输 
出 的 结果 也 能 清晰 地 看 到 “eden space 8192K、from space 1024K、to space 1024K” 的 信 
息 ， 新 生 代 总 可 用 空间 为 9216KB(Eden 区 +1 个 Survivor 区 的 总 容量 )。 

执行 testAllocation() 中 分 配 allocation4 对 象 的 语句 时 会 发 生 一 次 Minor GC， 这 次 GC 
的 结果 是 新 生 代 6651KB 变 为 148KB， 而 总 内 存 占用 量 则 几乎 没有 减少 (因为 allocation1、 
2、3 三 个 对 象 都 是 存活 的 ， 虚 拟 机 几乎 没有 找到 可 回收 的 对 象 )。 这 次 GC 发 生 的 原因 是 
给 allocation4 分 配 内 存 的 时 候 ， 发 现 Eden 已 经 被 占用 了 6MB， 剩 余 空间 已 不 足以 分 配 
allocation4 所 需 的 4MB 内 存 ， 因 此 发 生 Minor GC。GC 期 间 虚 拟 机 又 发 现 已 有 的 3 个 
2MB 大 小 的 对 象 全 部 无 法 放 入 Survivor 空间 (Survivor 空间 只 有 1MB 大 小 )， 所 以 只 好 通过 
分 配 担保 机 制 提前 转移 到 老年 代 去 。 

这 次 GC 结束 后 ，4MB 的 allocation4 对 象 被 顺利 分 配 在 Eden 中 。 因 此 程序 执行 完 的 
结果 是 Eden 占用 4MB( 被 allocation4 占用 )、Survivor 空 闪 、 老 年 代 被 占用 6MB( 被 
allocation1、2、3 占用 )。 通 过 GC 日 志 可 以 证 实 这 一 点 。 

新 生 代 GC(Minor GC): 指 发 生 在 新 生 代 的 垃圾 收集 动作 ， 因 为 Java 对 象 大 多 都 具备 
朝 生 夕 灭 的 特性 ， 所 以 Minor GC 非常 频繁 ， 一 般 回 收 速度 也 比较 快 。 

老年 代 GC(Major GC/Full GC): 指 发 生 在 老年 代 的 GC， 出 现 了 Major GC， 经 常会 伴 
随 至 少 一 次 的 Minor GC。 当 然 这 并 非 百 分 百 绝对 的 ， 在 ParallelScavenge 收集 器 的 收集 策 
略 里 就 有 直接 进行 Major GC 的 策略 选择 过 程 。MajorGC 的 速度 一 般 会 比 Minor GC 慢 10 


倍 以 上 。 
代码 清单 8-3 
private static final int 1MB = 1024 * 1024; 
/太太 
* VM 参数: -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:SurvivorRatio=8 
法 站 


public static void testAllocation() { 
byte[] allocationl, allocation2, allocation3, allocation4; 
allocationl = new byte[2 * 1MB]; 


allocation2 = new byte[2 * 1MB]; 

allocation3 = new byte[2 * 1MB]; 

allocation4 = new byte[4 * 1MB]; // 出 现 一 次 Minor GC 
} 
运行 结果 : 


[GC [DefNew: 6651K->148K(9216K), 0.0070106 secs] 

6651K->6292K (19456K), 0.0070426 secs] [Times: 

user=0.00l sys=0.00, real=0.00 secs] 

Heap 

def new generation total 9216K, used 4326K 
[0x029d0000，0x033d0000，0x033d0000) 

eden space 8192K, 51% used [0x029d0000, 0x02de4828, 0x031d0000) 
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from space 1024K, 14% used [0x032d0000, 0x032f5370, 0x033d0000) 

to space 1024K, 0% used [0x031d0000, 0x031d0000, 0x032d0000) 

tenured generation total 10240K, used 6144K [0x033d0000，0x03ddq0000，0x03dq0000) 
the space 10240K, 60% used [0x033d0000, 0x039d0030, 0x0399d0200, 0x03qdqd0000) 

compacting perm gen total 12288K, used 2114K [0x03dd0000, 0x049d0000,，0x07d90000) 
the space 12288K, 17% used [0x03dd0000，0x03fe0998，0x03fe0a00，0x049d0000) 

No shared spaces configured. 


8.9.2 ”大 对 象 直接 进入 老年 代 


所 谓 大 对 象 就 是 指 ， 需 要 大 量 连续 内 存 空间 的 Java 对 象 ， 最 典型 的 大 对 象 就 是 那 种 很 
长 的 字符 串 及 数组 。 大 对 象 对 虚拟 机 的 内 存 分 配 来 说 就 是 一 个 坏 消 息 ， 经 常 出 现 大 对 象 容 
易 导 致 内 存 还 有 不 少 空间 时 就 提前 触发 垃圾 收集 以 获取 足够 的 连续 空间 来 “安置 ”它们 。 

虚拟 机 提供 了 一 个 -XX:PretenureSizeThreshold 参数 ， 令 大 于 这 个 设置 值 的 对 象 直接 在 
老年 代 中 分 配 。 这 样 做 的 目的 是 避免 在 Eden 区 及 两 个 Survivor 区 之 间 发 生 大 量 的 内 存 
拷贝 。 

执行 代码 清单 8-4 中 的 testPretenureSizeThreshold() 方 法 后 ， 我 们 看 到 Eden 空间 几乎 没 
有 被 使 用 ， 而 老年 代 10MB 的 空间 被 使 用 了 40%， 也 就 是 4MB 的 allocation 对 象 直接 就 分 
配 在 老年 代 中 ， 这 是 因为 PretenureSizeThreshold 被 设置 为 3MB( 就 是 3145728B， 这 个 参数 
不 能 与 -Xmx 之 类 的 参数 一 样 直接 写 3MB)， 因 此 超过 3MB 的 对 象 都 会 直接 在 老年 代 中 进 
行 分 配 。 

注意 : PretenureSizeThreshold 参数 只 对 Serial 和 ParNew 两 款 收集 器 有 效 ，Parallel 
Scavenge 收集 器 不 认识 这 个 参数 ，Parallel Scavenge 收集 器 一 般 并 不 需要 设置 。 如 果 遇 到 
必须 使 用 此 参数 的 场合 ， 可 以 考虑 ParNew 加 CMS 的 收集 器 组 合 。 

代码 清单 8-4 


private static final int 1MB = 1024 * 1024; 


/** 

* VM 参数: -verbose:gc -Xms20M -Xmx20M -Xmn10M -XxX:SurvivorRatio=8 
* -XX:PretenureSizeThresholdq=3145728 

Eh 

public static void testPretenureSizeThreshold() { 

byte[] allocation; 

allocation = new byte[4 * 1MB]; // 直 接 分 配 在 老年 代 中 

} 


运行 结果 : 


Heap 
def new generation total 9216K, used 671K 
[0x029d0000，0x033d0000，0x033d0000) 

eden space 8192K, 8% used [0x029d0000, 0x02a77e98, 0x031d0000) 
from space 1024K, 0% used [0x031d0000, 0x031d0000, 0x032d0000) 

to space 1024K, 0% used [0x032d0000, 0x032d0000, 0x033d0000) 
tenured generation total 10240K, used 4096K [0x033d0000, 0x03dd0000, 
0x03ddq0000) 

the space 10240K, 40% used [0x033d0000, 0zx037d0010, 0x037d0200, 
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0x03dd0000) 

compacting perm gen total 12288K, used 2107K [0x03dd0000, 0x04990000,0x07dd0000) 
the space 12288K, 17% used [0x03dd0000，0x03fdefd0，0x03fdf000，0x049d0000) 

No shared spaces configured. 


8.9.3 长 期 存活 的 对 象 将 进入 老年 代 


虚拟 机 既然 采用 了 分 代 收 集 的 思想 来 管理 内 存 ， 那 内 存 回收 时 就 必须 能 识别 哪些 对 象 
应 当 放 在 新 生 代 ， 哪 些 对 象 应 放 在 老年 代 中 。 为 了 做 到 这 点 ， 虚 拟 机 给 每 个 对 象 定义 了 
一 个 对 象 年 龄 (Age) 计 数 器 。 如 果 对 象 在 Eden 出 生 并 经 过 第 一 次 Minor GC 后 仍然 存活 ， 
并 且 能 被 Survivor 容纳 的 话 ， 将 被 移动 到 Survivor 空间 中 ， 并 将 对 象 年 龄 设 为 1。 对 象 在 
Survivor 区 中 每 熬 过 一 次 Minor GC， 年 龄 就 增加 1 岁 ， 当 它 的 年 龄 增加 到 一 定 程 度 ( 默 
认为 15 岁 ) 时 ， 就 会 被 晋升 到 老年 代 中 。 对 象 晋 升 老 年 代 的 年 龄 阀 值 ， 可 以 通过 参数 
-XX:MaxTenuringThreshold 来 设置 

读者 可 以 试 试 分 别 以 -XX:MaxTenuringThreshold=1 和 -XX:MaxTenuringThreshold=15 两 
种 设置 来 执行 代码 清单 8-5 中 的 testTenuringThreshold() 方 法 ， 此 方法 中 allocationl 对 象 需 
要 256KB 的 内 存 空 间 ，Survivor 空间 可 以 容纳 。 当 MaxTenuringThreshold=1 时 ， 
allocationl 对 象 在 第 二 次 GC 发 生 时 进入 老年 代 ， 新 生 代 已 使 用 的 内 存 GC 后 会 非常 干净 
地 变 成 OKB。 而 MaxTenuringThreshold=15 时 ， 第 二 次 GC 发 生 后 ，allocationl 对 象 则 还 
留 在 新 生 代 的 Survivor 空间 ， 这 时 候 新 生 代 仍 然 有 404KB 的 空间 被 占用 。 

代码 清单 8-5 


private static final int 1MB = 1024 * 1024; 
/太太 
+ VM 参数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M 
-XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=1 
* -XX:+PrintTenuringDistribution 
让 
@SuppressWarnings ("unused") 
public static void testTenuringThreshold() { 
byte[] allocationl, allocation2, allocation3; 
allocationl = new byte[ 1MB / 4]; 

// 什么 时 候 进入 老年 代 取决 于 Xx:MaxTenuringThreshold 设置 


allocation2 = new byte[4 * 1MB]; 
allocation3 = new byte[4 * 1MB]; 
allocation3 = null; 

allocation3 = new byte[4 * 1MB]; 


js 
以 MaxTenuringThreshold=1 的 参数 设置 来 运行 的 结果 : 


[GC [DefNew 

Desired Survivor size 524288 bytes, new threshold 1 (max 1) 

=3098 "1 414664 bytes, 414664 total : 4859K->404K(9216K), 
0.0065012 secs] 4859K->4500K 

(19456K), 0.0065283 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] 
[GC [DefNew Desired Survivor size 524288 bytes, new threshold 1 (max 1) : 
4500K->0K (9216K), 0.0009253 secs] 8596K->4500K 

(19456K), 0.0009458 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
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Heap 
def new generation total 9216K, used 4178K 
[0x029dq0000，0x033d0000，0x033d0000) 

eden space 8192K, 51% used [0x029d0000，0x02de4828，0x031d0000) 

from space 1024K, 0% used [0x031d0000,0x031d0000, 0x032d0000) 

to space 1024K, 0% used [0x032d0000，0x032d0000，0x033d0000) 
tenured generation total 10240K, used 4500K [0x033d0000，0x03dd0000，0x03dd0000) 

the space 10240K, 43% used [0x033d0000, 0x03835348, 0x03835400, 0x03dqd0000) 
compacting perm gen total 12288K, used 2114K [0x03dd0000，0x049dq0000，0x07dd0000) 

the space 12288K, 17% used [0x03dd0000，0x03fe0998，0x03fe0a00，0x049d0000) 
No shared spaces configured. 


以 MaxTenuringThreshold=15 的 参数 设置 来 运行 的 结果 : 


[GC [DefNew 

Desired Survivor size 524288 bytes, new threshold 15 (max 15) 

-age 1: 414664 bytes, 414664 total : 4859K->404K(9216K), 
0.0049637 secs] 4859K-> 

4500K (19456K), 0.0049932 secs] [Times: user=0.00 sys=0.00, real=0.00 


secs 
[GC [DefNew Desired Survivor size 524288 bytes, new threshold 15 (max 15) 
J 414520 bytes, 414520 total : 4500K->404K(9216K), 


0.0008091 secs] 8596K-> 
4500K (19456K), 0.0008305 secs] [Times: user=0.00 sys=0.00, real=0.00 
secs 
Heap 
def new generation total 9216K, used 4582K 
[0x029d0000，0x033d0000，0x033d0000) 

eden space 8192K, 51% used [0x029d0000, 0x02de4828, 0x031d0000) 

from space 1024K, 39% used [0x031d0000, 0x03235338, 0x032d0000) 

to space 1024K, 0% used [0x032d0000, 0x032d0000, 0x033d0000) 
tenured generation total 10240K, used 4096K [0x033d0000，0x03dd0000， 
0x03dq0000) 

the space 10240K, 40% used [0x033d0000, 0x037d0010, 0x037d0200, 
0x03dd0000) 
compacting perm gen total 12288K, used 2114K [0x03dqd0000，0x049d0000， 
0x07dd0000) 

the space 12288K, 17% used [0x03dd0000,0x03fe0998, 0x03fe0a00, 
0x049d0000) 
No shared spaces configured. 


8.9.4 动态 对 象 年 龄 判定 


为 了 能 更 好 地 适应 不 同 程序 的 内 存 状况 ， 虚 拟 机 并 不 总 是 要 求 对 象 的 年 龄 必须 达到 
MaxTenuringThreshold 才能 晋升 老年 代 ， 如 果 在 Survivor 空间 中 相同 年 龄 所 有 对 象 大 小 的 
总 和 大 于 Survivor 空间 的 一 半 ， 年 龄 大 于 或 等 于 该 年 龄 的 对 象 就 可 以 直接 进入 老年 代 ， 无 
须 等 到 MaxTenuringThreshold 中 要 求 的 年 龄 。 

执行 代码 清单 8-6 中 的 testTenuringThreshold20 方法 ， 并 设置 参数 -XX: 
MaxTenuringThreshold=15， 会 发 现 运行 结 果 中 Survivor 的 空间 占用 仍然 为 0%， 而 老年 代 
比 预期 增加 了 6%， 也 就 是 说 allocation1、allocation2 对 象 都 直接 进入 了 老年 代 ， 而 没有 等 
到 15 岁 的 临界 年 龄 。 因 为 这 两 个 对 象 加 起 来 已 经 达到 了 512KB， 并 且 它们 是 同年 的 ， 满 
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所 折 机 开发; 


足 同 年 对 象 达到 Survivor 空间 的 一 半 规 则 。 我 们 只 要 注释 掉 其 中 一 个 对 象 的 new 操作 ， 就 
会 发 现 另外 一 个 不 会 晋升 到 老年 代 中 去 了 。 
代码 清单 8-6 


private static final int 1MB = 1024 * 1024; 
/广大 
* VM 参 数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M 
-XX:SurVvivorRatio=8 -XX:MaxTenuringThreshold=15 
* -XX:+PrintTenuringDistribution 
@SuppressWarnings ("unused") 
public static void testTenuringThreshold2() { 
byte[] allocationl, allocation2, allocation3, allocation4; 
allocationl = new byte[ 1MB / 4]; 

// allocationl+allocation2 大 于 survivor 空间 的 一 半 
allocation2 = new byte[ 1MB / 4]; 

allocation3 = new byte[4 * 1MB]; 


allocation4 = new byte[4 * 1MB]; 

allocation4 = null; 

allocation4 = new byte[4 * 1MB]; 

} 

运行 结果 : 

[GC [DefNew 

Desired Survivor size 524288 bytes, new threshold 1 (max 15) 

Ja Ls 676824 bytes, 676824 total : 5115K->660K(9216K), 0.0050136 


secs] 5115K-> 
4756K (19456K), 0.0050443 secs] [Times: user=0.00 
sys=0.01, real=0.01 secs] 
[GC [DefNew 
Desired Survivor size 524288 bytes, new threshold 15 (max 15) 
: 4756K->0K(9216K), 0.0010571 secs] 8852K->4756K 
(19456K), 0.0011009 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap 
def new generation total 9216K, used 4178K [0x029d0000，0x033d0000， 
0x033d0000) 
eden space 8192K, 51% used [0x029d0000，0x02de4828，0x031d0000) 
from space 1024K, 0% used [0x031d0000，0x031d0000，0x032d0000) 
to space 1024K, 0% used [0x032d0000, 0x032d0000, 0x033d0000) 
tenured generation total 10240K, used 4756K [0x033d0000, 0x03dd0000, 
0x03dd0000) 
the space 10240K, 46% used [0x033d0000，0x038753e8，0x03875400，0x03dq0000) 
compacting perm gen total 12288K, used 2114K [0x03dd0000, 0x049d0000, 
0x07dd0000) 
the space 12288K, 17% used [0x03dd0000, 0x03fe09a0, 0x03fe0a00, 0x049d0000) 
No shared spaces configured. 


8.9.5 空间 分 配 担保 


在 发 生 Minor GC 时 ， 虚 拟 机 会 检测 之 前 每 次 晋升 到 老年 代 的 平均 大 小 是 否 大 于 老年 
代 的 剩余 空间 大 小 ， 如 果 大 于 ， 则 改 为 直接 进行 一 次 Full GC; 如 果 小 于 ， 则 查看 
HandlePromotionFailure 设置 是 否 允 许 担保 失败 ; 如 果 人 允许 ， 那 只 会 进行 Minor GC; 如 果 
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不 允许 ， 则 也 要 改 为 进行 一 次 Full GC。 


前 面 提 到 过 ， 新 生 代 使 用 复制 收集 算法 ， 但 为 了 内 存 利用 率 ， 只 使 用 其 中 一 个 
Survivor 空间 来 作为 轮换 备份 ， 因 此 当 出 现 大 量 对 象 在 Minor GC 后 仍然 存活 的 情况 时 ， 最 
极端 就 是 内 存 回 收 后 新 生 代 中 所 有 对 象 都 存活 ， 就 需要 老年 代 进行 分 配 担保 ， 让 Survivor 
无 法 容纳 的 对 象 直接 进入 老年 代 。 与 生活 中 的 贷款 担保 类 似 ， 老 年 代 要 进行 这 样 的 担保 ， 
前 提 是 老年 代 本 身 还 有 容纳 这 些 对 象 的 剩余 空间 ， 一 共有 多 少 对 象 会 活 下 来 ， 在 实际 完成 
内 存 回 收 之 前 是 无 法 明确 知道 的 ， 所 以 只 好 取 之 前 每 一 次 回收 晋升 到 老年 代 对 象 容量 的 平 
均 大 小 值 作为 经 验 值 ， 与 老年 代 的 剩余 空间 进行 比较 ， 决 定 是 否 进行 Full GC 来 让 老年 代 
腾 出 更 多 空间 。 

取 平 均值 进行 比较 其 实 仍然 是 一 种 动态 概率 的 手段 ， 也 就 是 说 如 果 某 次 Minor GC 存 
活 后 的 对 象 突 增 ， 远 远 高 于 平均 值 的 话 ， 依 然 会 导致 担保 失败 (Handle Promotion Failure)。 
如 果 出 现 了 HandlePromotionFailure 失败 ， 那 就 只 好 在 失败 后 重新 发 起 一 次 Full GC。 虽 然 
担保 失败 时 绕 的 圈子 是 最 大 的 ， 但 大 部 分 情况 下 都 还 是 会 将 HandlePromotionFailure 开关 
打开 ， 避 免 Full GC 过 于 频繁 ， 参 见 代码 清单 8-7。 

代码 清单 8-7 


private static final int 1MB = 1024 * 1024; 

/** 

* VM 参数: -verbose:gc -Xms20M -Xmx20M -Xmn10M 
-XX:SurvivorRatio=8 -XX:-— 

HandlePromotionFailure 

st 

Q@SuppressWarnings ("unused") 

public static void testHandlePromotion() { 

byte[] allocationl, allocation2, allocation3, 
allocation4, allocation5, allocation6, allocation7; 


allocationl = new byte[2 * 1MB]; 
allocation2 = new byte[2 * 1MB]; 
allocation3 = new byte[2 * 1MB]; 
allocationl = null; 
allocation4 = new byte[2 * 1MB]; 
allocation5 = new byte[2 * 1MB]; 
allocation6 = new byte[2 * 1MB]; 
allocation4 = null; 
allocation5 = null; 
allocation6 = null; 
allocation7 = new byte[2 * 1MB]; 


村 
以 HandlePromotionFailure = false 的 参数 设置 来 运行 的 结果 : 


[GC [DefNew: 6651K->148K (9216K), 0.0078936 secs] 

6651K—>4244K (19456K), 0.0079192 secs] [Times: user=0.00 sys=0.02, real=0.02 secs] 
[GC [DefNew: 6378K->6378K(9216K), 0.0000206 secs] 

[Tenured: 4096K->4244K(10240K), 0.0042901 secs] 

10474K->4244K (19456K), [Perm : 2104K->2104K(12288K) ] ,0.0043613 secs] [Times: 
user=0.00 sys=0.00, real=0.00 secs] 


以 MaxTenuringThreshold= true 的 参数 设置 来 运行 的 结果 : 
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[GC [DefNew: 6651K->148K(9216K) ，0.0054913 secs] 

6651K->4244K (19456K), 0.0055327 secs] [Times:user=0.00 sys=0.00, real=0.00 secs] 

[GC [DefNew: 6378K->148K(9216K), 0.0006584 secs] 

10474K->4244K (19456K), 0.0006857 secs] [Times: user=0.00 sys=0.00, real=0.00 

secs] 

本 章 介 绍 了 垃圾 收集 的 算法 、 几 款 JDK 1.6 中 提供 的 垃圾 收集 器 的 特点 及 其 运作 原 
。 通 过 代码 实例 验证 了 Java 虚拟 机 中 自动 内 存 分 配 及 回收 的 主要 规则 。 

内 存 回 收 与 垃圾 收集 器 在 很 多 时 候 都 是 影响 系统 性 能 和 并 发 能 力 的 主要 因素 之 一 ， 虚 
拟 机 之 所 以 提供 多 种 不 同 的 收集 器 及 大 量 的 调节 参数 ， 是 因为 只 有 根据 实际 应 用 需求 和 实 
现 方式 选择 最 优 的 收集 方式 才能 获取 最 好 的 性 能 。 没 有 固定 收集 器 和 参数 组 合 ， 也 就 没有 
最 优 的 调 优 方法 ， 虚 拟 机 也 没有 什么 必然 的 内 存 回收 行为 。 因 此 学 习 虚 拟 机 的 内 存 知 识 ， 
如 果 要 到 实践 调 优 阶段 ， 必 须 了 解 每 个 具体 收集 器 的 行为 、 优 势 和 劣势 、 调 节 参 数 。 
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高 效 手 段 之 性 能 监控 工具 


”和 优化 部 署 


前 面 已 经 对 虚拟 机 内 存 分 配 与 回收 技术 各 方面 做 了 介绍 ， 相 信 读 者 已 经 建 
立 了 一 个 比较 完整 的 理论 基础 。 理 论 总 是 作为 指导 实践 的 工具 ， 能 把 这 些 知 识 
投入 到 实际 工作 中 才 是 我 们 的 最 终 目的 。 接 下 来 的 两 章 ， 我 们 将 从 实践 的 角度 
去 了 解 虚拟 机 内 存 管理 的 世界 。 

本 章 将 详细 讲解 使 用 性 能 工具 和 实现 优化 部 署 的 基本 知识 ， 为 读者 学 习 后 
面 的 知识 打下 基础 。 


9.1 JDK 的 命令 行 工 具 


Java 开发 人 员 肯 定 都 知道 JDK 的 bin 目录 中 有 “java.exe” 和 “javac.exe” 这 两 个 命令 
行 工具 ， 但 并 非 所 有 程序 员 都 了 解 过 JDK 的 bin 目录 之 中 其 他 命令 行程 序 的 作用 。 每 着 
JDK 更 新 版 本 时 ，bin 目录 下 命令 行 工 具 的 数量 和 功能 总 会 不 知 不 觉 地 增加 和 增强 。 

本 章 笔者 将 介绍 这 些 工具 的 其 中 一 部 分 ， 主 要 介绍 用 于 监视 虚拟 机 和 故障 处 理 的 工 
具 。 这 些 故障 处 理工 具 被 Sun 公司 作为 “礼物 ” 附 赠 给 JDK 的 使 用 者 ， 在 软件 的 使 用 说 明 
中 把 它们 声明 为 “没有 技术 支持 并 且 是 实验 性 质 的 ”(Unsupported and Experimental) 产 品 ， 
但 事实 上 这 些 工 具 都 非常 稳定 而 且 功能 强大 ， 能 在 处 理应 用 程序 性 能 问题 、 定 位 故障 时 发 
挥 很 大 的 作用 。 

说 起 JDK 的 工具 ， 读 者 如 果 比 较 细 心 的 话 ， 可 能 会 注意 到 这 些 工 具 的 程序 体积 都 异常 

的 小 。 其 实 各 个 工具 的 体积 基本 上 都 稳定 在 27KB 左右 。 并 非 JDK 开发 团队 刻意 把 它们 制 
作 得 如 此 精炼 来 炫耀 编程 水 平 ， 而 是 因为 这 些 命令 行 工 具 大 多 数 是 jdk\lib\tools.jar 类 库 的 
一 层 薄 包装 而 已 ， 它 们 主要 的 功能 代码 是 在 tools 类 库 中 实现 的 。 读 者 用 图 9-1 和 图 9-2 两 
张 图 片 对 比 一 下 就 可 以 看 得 很 清楚 。 


Bo fies javadoc exe 加 natve2asciexe xhtmibar.acp 
ansictl 回 avanexe 回 orodexe 回 xcexe 
appletviewerexe Jjavap exe 加 paci200 .exe 图 xmstx 
加 apt exe 回 java-rmiexe [到 packager exe 

国 beanreg oi 历 Javaw.exe perlacp 

图 controlcd 图 avawsexe 国 perlstx 

国 cppacp 回 jconsoe exe 图 pnpst 

cop stx jib exe 四 policytoolexe 

cs stx 加 hatexe 加 rmic.exe 

图 cssz cl 回 infoexe 回 "maexe 

css cl ja 轩 rmregstry ee 

图 css sk 器 jmapexe 回 :cnemagen exe 

extcheck exe 加 ps ee 加 seralver exe 

htmis.ct jrunscrpt exe 加 servertoolexe 

htmLctl 固 sstx [ed template cpp 

htmLstx 国 sp stx 想 ] template ntml 

国 htmbaracp istack exe 目 template java 
HimiConverter exe 回 jstatexe 目 tempate pl 

习 aiexe tatd exe Btemplatex html 

jar.exe "visuavmexe 畴 tnamesen exe 

jarsioner exe 加 weytoolexe 国 unpaci200.exe 

回 javaacp 回 Mnrexe 国 wsx 

划 java exe 加 Wistexe es vsgen.exe 

国 Bvastx 加 Hab exe Wsimport.exe 

javac.exe 国 msver71dl Eh ctl 


9-1 bin 目录 


假如 读者 使 用 的 是 Linux 版 本 的 JDK， 还 会 发 现 这 些 工 具 中 很 多 甚至 就 是 由 Shell 脚 
本 直接 写成 的 ， 可 以 用 vim 直接 打开 它们 。JDK 开发 团队 选择 采用 Java 代码 来 实现 这 些 监 
控 工 具 是 有 特别 用 意 的 : 当 应 用 程序 部 署 到 生产 环境 后 ， 无 论 是 直接 接触 物理 服务 器 还 是 
远程 Telnet 到 服务 器 上 都 可 能 会 受到 限制 。 借 助 toolsjar 类 库 里 面 的 接口 ， 我 们 可 以 直接 
在 应 用 程序 中 实现 功能 强大 的 监控 分 析 功 能 。 
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图 9-2 toolsjar 包 的 情况 


注意 : tools.jar 中 的 类 库 不 属于 Java 的 标准 API， 如 果 引 入 这 个 类 库 ， 就 意味 着 你 的 
程序 只 能 运行 于 Sun Hotspot( 或 一 些 从 Sun 买 了 JDK 的 源码 License 的 虚拟 机 ， 如 IBM 
J9、BEA JRockit) 上 面 ， 或 者 在 部 署 程 序 时 需要 一 起 部 署 toolsjar。 

需要 特别 说 明 的 是 ， 本 章 介 绍 的 工具 全 部 基于 Windows 平台 下 的 JDK 1.6 Update 21， 
如 果 JDK 版 本 、 操 作 系统 不 同 ， 工 具 所 支持 的 功能 可 能 会 有 较 大 差别 。 大 部 分 工具 在 JDK 
1.5 中 就 已 经 提供 ， 但 为 了 避免 运行 环境 带 来 的 差异 和 兼容 性 问题 ， 建 议 读者 使 用 JDK 1.6 
来 验证 本 章 介绍 的 内 容 ， 因 为 JDK 1.6 的 工具 可 以 正常 兼容 运行 于 JDK 1.5 的 虚拟 机 之 上 的 
程序 ， 反 之 则 不 一 定 。 

如 果 读 者 在 工作 中 需要 监控 运行 于 JDK 1.5 的 虚拟 机 之 上 的 程序 ， 在 程序 启动 时 请 添 
加 参数 “-Dcom.sun.management.jmxremote ”开启 JMX 管理 功能 ， 和 否则 由 于 部 分 工具 都 是 
基于 JMX 的 (包括 下 一 节 的 可 视 化 工具 )， 因 此 它们 都 将 会 无 法 使 用 ， 如 果 被 监控 程序 运行 
于 JDK 1.6 的 虚拟 机 之 上 ， 那 JMX 管理 默认 是 开启 的 ， re neti 
数 。Sun JDK 监控 和 故障 处 理工 具 的 主要 说 明 如 下 。 

口 jps: 功能 是 VM Process Status Tool， 显 示 指 定 系统 内 所 有 的 HotSpot 虚拟 机 

进程 。 

口 jstat: 功能 是 JVM Statistics Monitoring Tool， 用 于 收集 HotSpot 虚拟 机 各 方面 的 

运行 数据 。 
口 ”jinfo: 功能 是 Configuration Info for Java， 显 示 虚 拟 机 配置 信息 。 
口 ”jmap: 功能 是 Memory Map for Java， 生 成 虚拟 机 的 内 存 转 储 快照 (eapdump 文 
件 )。 

口 ”jhat: 功能 是 JVM Heap Dump Browser， 用 于 分 析 heapdump 文件 ， 它 会 建立 一 个 
HTTP/HTML 服务 器 ， 让 用 户 可 以 在 浏览 器 上 查看 分 析 结果 。 

口 jstack: 功能 是 Stack Trace for Java， 显 示 虚 拟 机 的 线程 快照 。 
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9.1.1 jps: 虚拟 机 进程 状况 工具 


JDK 的 很 多 小 工具 的 名 字 都 参考 了 Unix 命令 的 命名 方式 ， 例 如 jps (JVM Process 
Status Tool) 是 其 中 的 典型 。 除 了 名 字 像 Unix 的 ps 命令 之 外 ， 它 的 功能 也 和 ps 命令 类 似 : 
可 以 列 出 正在 运行 的 虚拟 机 进程 ， 并 显示 虚拟 机 执行 主 类 (Main Class，main() 函 数 所 在 的 
类 ) 的 名 称 ， 以 及 这 些 进程 的 本 地 虚拟 机 的 唯一 ID(Local Virtual Machine Identifier，LVMID)。 
虽然 功能 比较 单一 ， 但 它 是 使 用 频率 最 高 的 JDK 命令 行 工 具 ， 因 为 其 他 的 JDK 工具 大 多 
须要 输入 它 查询 到 的 LVMID 来 确定 要 监控 的 是 哪 一 个 虚拟 机 进程 。 对 于 本 地 虚拟 机 进程 
来 说 ，LVMID 与 操作 系统 的 进程 ID (Process Identifier，PID) 是 一 致 的 ， 使 用 Windows 的 
任务 管理 器 或 UNIX 的 ps 命令 也 可 以 查询 到 虚拟 机 进程 的 LVMID， 但 如 果 同 时 启动 了 多 
个 虚拟 机 进程 ， 无 法 根据 进程 名 称 定位 时 ， 那 就 只 能 依赖 jps 命令 显示 主 类 的 功能 才能 区 
着 

使 用 jps 命令 的 格式 如 下 : 


jps [options] [hos tid] 


jps 命令 的 功能 是 列 出 在 运行 的 虚拟 机 进程 ， 并 显示 虚拟 机 执行 主 类 (Main?Class,?main 
函数 所 在 的 类 ) 的 名 称 ， 以 及 这 些 进 程 的 本 地 虚拟 机 的 唯一 
ID(LVMID,Local?Virtual?Machine?Identifier)。 

jps 可 以 通过 RMI 协议 查询 开启 了 RMI 服务 的 远程 虚拟 机 进程 状态 ，hostid 为 RMI 注 
册 表 中 注册 的 主机 名 。jps 的 其 他 常用 选项 如 下 。 

口 -q: 功能 是 只 输出 LVMID， 省 略 主 类 的 名 称 。 

口 -m: 功能 是 输出 虚拟 机 进程 启动 时 传递 给 主 类 main() 函 数 的 参数 。 

口 -1: 功能 是 输出 主 类 的 全 名 ， 如 果 进 程 执行 的 是 Jar 包 ， 则 输出 Jar 路 径 。 

口 -v: 功能 是 输出 虚拟 机 进程 启动 时 JVM 参数 。 

使 用 方法 是 进入 到 java 的 安装 目录 ， 位 于 bin 目录 下 有 很 多 的 工具 ， 其 中 一 个 名 为 
jps.exe 就 是 此 工具 。 图 9-3 是 使 用 jps 命令 的 例子 。 


图 9-3 使 用 jps 命令 的 例子 


如 果 直 接 输入 jps 命令 ， 则 会 显示 进程 ID 和 主 类 的 名 称 或 jar 的 名 称 ， 而 且 该 命令 还 
支持 一 些 参数 。 例 如 -q 只 输出 LVMID， 省 略 主 类 的 名 称 ， 如 图 9-4 所 示 。 


9-4 ”使 用 -q 选项 参数 
而 选项 -m 可 以 输出 虚拟 机 进程 启动 时 传递 给 主 类 main() 函 数 的 参数 ， 如 图 9-5 所 示 。 
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9-5 使用-m 选项 参数 


而 选项 -1 可 以 输出 主 类 的 全 名 ， 如 果 进 程 执行 的 是 Jar 包 ， 则 输出 Jar 路 径 ， 如 图 9-6 
所 示 。 


图 9-6 ”使 用 -| 选项 参数 
而 -v 可 以 输出 虚拟 机 进程 启动 时 JVM 参数 ， 如 图 9-7 所 示 。 


activation.j all\MyEclipse 
6.5.8 lipse 
ec lipse \ec lip: 
B886 \data\libr 


lip 


eclipse plugin 
8886 \data\libraryset\i .4 


Xnsi28n -YXmx512m —Du 


:\Progran Files\Java\jdki.6.0_1 


图 9-7 使 用 -v 选项 参数 


9.1.2 jstat: 虚拟 机 统计 信息 监视 工具 

jstat (JVM Statistics Monitoring Tool) 是 用 于 监视 虚拟 机 各 种 运行 状态 信息 的 命令 行 工 
具 。 它 可 以 显示 本 地 或 远程 虚拟 机 进程 中 的 类 装载 、 内 存 、 垃 圾 收集 、JIT 编译 等 运行 数 
据 ， 在 没有 GUI 图 形 界面 ， 只 提供 了 纯 文本 控制 台 环 境 的 服务 器 上 ， 它 将 是 运行 期 定位 虚 
拟 机 性 能 问题 的 首选 工具 。 
使 用 jstat 命令 的 格式 为 : 
jstat [generalOption | outputoptions vmid [interval[s|lms] [count]]] 


对 于 命令 格式 中 的 VMID 与 LVMID 需要 特别 说 明 一 下 : 如 果 是 本 地 虚拟 机 进程 ， 
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权衡 优化 、 高 效 和 安全 的 最 优 方案 
VMID 与 LVMID 是 一 致 的 ， 如 果 是 远程 虚拟 机 进程 ， 那 VMID 的 格式 应 当 是 : 


jstat -gc 2764 250 20 
jstat 命令 中 各 个 选项 的 具体 说 明 如 下 。 
1. generalOption 


口 ” -help: 帮助 。 
口 ”-options: 打印 选项 。 


2. outputOptions 


这 是 一 个 输出 选项 ， 参 数 如 下 。 
口 -hn: 每 n 个 样本 ， 显 示 header 一 次 。 
口 -tn: 在 第 一 列 显示 时 间 戳 列 ， 时 间 惟 时 从 jvm 启动 开始 计算 。 
口 “-Jvmoption: 传递 jvm 选项 。 
口 “-statOption: 决定 统计 什么 信息 。 
(1) class: 用 于 统计 classloader 的 行为 ， 主 要 选项 的 说 明 如 下 。 
口 Loaded: 被 读 入 类 的 数量 。 
Bytes: 被 读 入 的 字 节 数 (K)。 
Unloaded: 被 抒 载 类 的 数量 。 
Bytes: 被 卸载 的 字 节 数 (区 )。 
Time: 花费 在 load 和 unload 类 的 时 间 。 
compiler: 用 于 统计 hotspot just-in-time 编译 器 的 行为 ， 主 要 选项 的 说 明 如 下 。 
Compiled: 被 执行 的 编译 任务 的 数量 。 
Failed: 失败 的 编译 任务 的 数量 。 
Invalid: 无 效 的 编译 任务 的 数量 。 
Time: 花费 在 执行 编译 任务 的 时 间 。 
FailedType: 最 近 失 败 编译 的 编译 类 名 。 
FailedMethod: 最 近 失 败 编译 的 类 名 和 方法 名 。 
) gc: 用 于 统计 gc 行为 ， 主 要 选项 的 说 明 如 下 。 
S0C: 当前 S0 的 容量 (KB)。 
S1C: 当前 S1 的 容量 (KB)。 
S0U: S0 的 使 用 (KB)。 
S1U: S1 的 使 用 (KB)。 
EC: 当前 eden 的 容量 (KB)。 
EU: eden 的 使 用 (KB)。 
OC: 当前 old 的 容量 (KB)。 
OU: old 的 使 用 (KB)。 
PC : 当前 perm 的 容量 (KB)。 
PU: perm 的 使 用 (KB)。 


fi ava 
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YGC: young 代 gc 的 次 数 。 
YGCT: young 代 gc 花费 的 时 间 。 
FGC: full gc 的 次 数 。 
FGCT: full gc 的 时 间 。 
口 GCT: 垃圾 收集 收集 的 总 时 间 。 
(4) gccapacity: 用 于 统计 堆 中 代 的 容量 、 空 间 ， 主 要 选项 的 说 明 如 下 。 
口 NGCMN: 年 轻 代 的 最 小 容量 (KB)。 
NGCMX: 年 轻 代 的 最 大 容量 (KB)。 
NGC: 当前 年 轻 代 的 容量 (KB)。 
SOC: 当前 S0 的 空间 (KB)。 
S1C: 当前 S1 的 空间 (KB)。 
EC: 当前 eden 的 空间 (KB)。 
OGCMN: 年 老 代 的 最 小 容量 (KB)。 
OGCMX: 年 老 代 的 最 大 容量 (KB)。 
OGC: 当前 年 老 代 的 容量 (KB)。 
OC: 当前 年 老 代 的 空间 (KB)。 
PGCMN: 永久 代 的 最 小 容量 (KB)。 
PGCMX: 永久 代 的 最 大 容量 (KB)。 
PGC: 当前 永久 代 的 容量 (KB)。 
PC: 当前 永久 代 的 空间 (KB)。 
YGC: 年 轻 代 gc 的 次 数 。 
口 FGC: full gc 的 次 数 。 
(5) gccause: 垃圾 收集 统计 ， 包 括 最 近 引 用 垃圾 收集 的 事件 ， 基 本 同 gcutil， 只 是 比 
gcutil 多 了 两 列 。 主 要 选项 的 说 明 如 下 。 
口 LGCC: 最 近 垃 圾 回收 的 原因 。 
口 GCC: 当前 垃圾 回收 的 原因 。 
(6) gcnew: 用 于 统计 新 生 代 的 行为 ， 主 要 选项 的 说 明 如 下 。 
口 SOC: 当前 S0 空间 (KB)。 
S1C: 当前 S1 空间 (KB)。 
S0U: S0 空间 使 用 (KB)。 
S1U: S1 空间 使 用 (KB)。 
MTT: 最 大 的 tenuring threshold。 
DSS: 希望 的 Survivor 大 小 (KB)。 
EC: 当前 eden 空间 (KB)。 
EU: eden 空间 使 用 (KB)。 
YGC: 年 轻 代 gc 次 数 。 
口 YGCT: 年 轻 代 垃 圾 收集 时 间 。 
(7) gcnewcapacity: 用 于 统计 新 生 代 的 大 小 和 空间 ， 主 要 选项 的 说 明 如 下 。 
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NGCMN: 最 小 的 年 轻 代 的 容量 (KB)。 
NGCMX: 最 大 的 年 轻 代 的 容量 (KB)。 
NGC: 当前 年 轻 代 的 容量 (KB)。 
SOCMX: 最 大 的 S0 空间 (KB)。 

S0C: 当前 S0 空间 (KB)。 

SICMX: 最 大 的 S1 空间 KB)。 

S1C: 当前 S1 空间 (KB)。 

ECMX: 最 大 eden 空间 (KB)。 

EC: 当前 eden 空间 (KB)。 

YGC: 年 轻 代 gc 数量 。 

FGC: full gc 数量 。 

) gcold: 用 于 统计 旧 生 代 的 行为 ， 主 要 选项 的 说 明 如 下 。 
PC: 当前 perm 空间 (KB)。 

PU: perm 空间 使 用 (KB)。 
OC: 当前 old 空间 (KB)。 
OU old 空间 使 用 (KB)。 
YGC: 年 轻 代 gc 次 数 。 
FGC: full gc 次 数 。 
FGCT: full gc 时 间 。 
GCT: 垃圾 收集 总 时 间 。 

) gcoldcapacity: 统计 旧 生 代 的 大 小 和 空间 ， 主 要 选项 的 说 明 如 下 。 
OGCMN: 最 小 年 老 代 容量 (KB)。 
OGCMX: 最 大 年 老 代 容量 (KB)。 
OGC: 当前 年 老 代 容量 (KB)。 

OC: 当前 年 老 代 空间 (KB)。 
YGC: 年 轻 代 gc 次 数 。 
FGC: full gc 次 数 。 

FGCT: full gc 时 间 。 

GCT: 垃圾 收集 总 时 间 。 

0) gcpermcapacity: 用 于 统计 永久 代 的 大 小 和 空间 ， 主 要 选项 的 说 明 如 下 。 
PGCMN: 永久 代 最 小 容量 (KB)。 
PGCMX: 永久 代 最 大 容量 (KB)。 
PGC: 当前 永久 代 的 容量 (KB)。 

PC: 当前 永久 代 的 空间 (KB)。 
YGC: 年 轻 代 gc 次 数 。 
FGC: full gc 次 数 。 

FGCT: full gc 时 间 。 

GCT: 垃圾 收集 总 时 间 。 
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(11) gcutil: 实现 垃圾 收集 统计 ， 主 要 选项 的 说 明 如 下 。 

口 “S0: S0 使 用 百分比 。 

S1: Sl 使 用 百分比 。 

E: eden 使 用 百分比 。 

O: old 使 用 百分比 。 

P: perm 使 用 百分比 。 

YGC: 年 轻 代 gc 次 数 。 

YGCT: 年 轻 代 gc 时 间 。 

FGC: full gc 次 数 。 

FGCT: full gc 时 间 。 

GCT: 垃圾 收集 总 时 间 。 

(12) printcompilation: hotspot 编译 方法 统计 ， 主 要 选项 的 说 明 如 下 。 

Compiled: 被 执行 的 编译 任务 的 数量 。 

Size: 方法 字 节 码 的 字 节 数 。 

Type: 编译 类 型 。 

Method: 编译 方法 的 类 名 和 方法 名 。 类 名 使 用 “/” 代 替 “.” 作 为 空间 分 隔 符 ， 
方法 名 是 给 出 类 的 方法 名 ， 格 式 是 一 致 于 HotSpot - XX:+PrintComplation 选项 。 


3. vmid 

表示 虚拟 机 标识 符 ， 格 式 为 

[protocol :][//]lwmid [@hostname [:port ]/servername ] 
4. interval: 显示 间隔 

5. count 


count 的 功能 是 显示 次 数 ， 例 如 每 隔 5 秒 显示 在 127.0.0.1 机 器 上 的 18668jvm 的 
classloader 相关 信息 ， 一 共 显示 100 次 ， 并 且 每 5 次 显示 一 个 列 头 ， 显 示 时 间 惟 。 每 隔 5 
秒 显 示 在 127.0.0.1 机 器 上 的 18668jvm 的 gc 统计 相关 信息 ， 一 共 显示 100 次 ， 并 且 每 5 次 
显示 一 个 列 头 ， 显 示 时 间 戳 。 

使 用 jstat 命令 监测 内 存 使 用 和 垃圾 回收 统计 数据 : 

$ <JDK>/bin/jstat -gcutil [-h<lines>] <pid> <interval> 

口 jstat 一 gcutil: 选项 打印 所 运行 应 用 程序 进程 ID。 

口 <pid>: 在 指定 抽样 间隔 <interval> 下 ， 堆 使 用 及 垃圾 回收 时 间 摘 要 ， 并 且 每 

<lines> 行 显示 一 次 头 信 息 。 会 产生 如 下 样 例 输出 : 


S0 S1 E 0 2 YGC YGCT FGC FGCT GCT 

0.00 0.00 24.48 46.60 90.24 142 0.530 104 28.739 29.269 
0.00 0.00 2.38 51.08 90.24 144 0.536 106 29.280 29.816 
0.00 0.00 36.52 51.08 90.24 144 0.536 106 29.280 29.816 
O00026.620 36:129 S112 90:24 145 W02538 0911029.55230.090 
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9.1.3 jinfo: Java 配置 信息 工具 


jinfo (Configuration Info for Java) 的 作用 是 实时 查看 和 调整 虚拟 机 的 各 项 参数 。 使 用 jps 
命令 的 “-V” 参 数 可 以 查看 虚拟 机 启动 时 显 式 指定 的 参数 列表 ， 但 如 果 想 知道 未 被 显 式 指 
定 的 参数 的 系统 默认 值 ， 除 了 去 找 资料 外 ， 就 只 能 使 用 jinfo 的 “-flag” 选 项 进行 查询 了 。 
如 果 只 限于 JDK 1.6 或 以 上 版 本 的 话 ， 使 用 java -XX:+PrintFlagsFinal 查看 参数 默认 值 也 是 
一 个 很 好 的 选择 。jinfo 还 可 以 使 用 -sysprops 选项 把 虚拟 机 进程 的 System.getProperties() 的 
内 容 打印 出 来 。 这 个 命令 在 JDK 15 版 本 中 已 经 随 着 Linux 版 的 JDK 而 发 布 ， 当 时 只 提供 
了 信息 查询 的 功能 。 在 JDK 1.6 之 后 ，jinfo 在 Windows 和 Linux 平台 都 有 提供 ， 并 且 加 入 
了 运行 期 修改 参数 的 能 力 ， 可 以 使 用 -flag [+l-]name 或 -flag name=value 修改 一 部 分 运行 期 
可 写 的 虚拟 机 参数 值 。JDK 1.6 中 ，jinfo 对 于 Windows 平台 的 功能 仍然 有 较 大 的 限制 ， 只 
提供 了 最 基本 的 -flag 选项 。 

使 用 jinfo 命令 的 格式 如 下 : 

jinfo[option]pid 

例如 下 面 的 命令 可 以 查询 CMSInitiatingOccupancyFraction 参数 值 。 


C:\>jinfo -flag CMSInitiatingoccupancyFraction 1444 
- xx:CMSInitiatingOccupancyFraction=85 


9.1.4 jmap: Java 内 存 映 像 工具 


通过 jmap(Memory Map for Java) 命 令 可 以 生成 堆 转 储 快照 (一 般 称 为 heapdump 或 dump 
文件 )。 如 果 不 使 用 jmap 命令 ， 要 想 获取 Java 堆 转 储 快 照 还 有 一 些 比较 “暴力 ”的 手段 ， 
例如 用 -XX: +HeapDumpOnOutOfMemoryError 参数 可 以 让 虚拟 机 在 OOM 异常 出 现 之 后 自 
动 生成 dump 文件 ， 通 过 -XX: +HeapDumpOnCtrlBreak 参数 则 可 以 使 用 Ctrl+Break 键 让 虚 
拟 机 生成 dump 文件 ， 又 或 者 在 Linux 系统 下 通过 Kill.3 命令 发 送 进程 退出 信号 “恐吓 ” 
一 下 虚拟 机 ， 也 能 拿 到 dump 文件 。 

命令 jmap 的 作用 并 不 仅仅 是 为 了 获取 dump 文件 ， 它 还 可 以 查询 finalize 执行 队列 ， 
Java 堆 和 永久 代 的 详细 信息 ， 如 空间 使 用 率 、 当 前 用 的 是 哪 种 收集 器 等 。 和 jinfo 命令 一 
样 ，jmap 有 不 少 功能 在 Windows 平台 下 都 是 受 限 的 ， 除 了 生成 dump 文件 的 -dump 选项 和 
用 于 查看 每 个 类 的 实例 、 空 间 占用 统计 的 -histo 选项 所 有 操作 系统 都 提供 之 外 ， 其 余 选项 
都 只 能 在 Linux/Solaris 下 使 用 。 

使 用 jmap 命令 的 格式 如 下 : 

jmap [option]vmid 

选项 option 的 合法 值 与 具体 含义 如 下 。 

口 “-dump: 功能 是 生成 Java 堆 转 储 快照 。 格 式 为 : 


-dump: [live, ] format=b, file=<flename> 


其 中 liv 子 参数 说 明 是 否 只 dump 出 存活 的 对 象 。 
口 ”-finalizerinfo: 功能 是 显示 在 F-Queue 中 等 待 Finalizer 线程 执行 finalize 方法 的 对 
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象 ， 只 在 Linux/Solaris 平台 下 有 效 。 

口 “-heap: 功能 是 显示 Java 堆 详细 信息 ， 如 使 用 哪 种 回收 器 、 参 数 配置 、 分 代 状 况 
等 ， 只 在 Linux/Solaris 平台 下 有 效 。 

口 ”-histo: 显示 堆 中 对 象 统计 信息 ， 包 括 类 、 实 例 数 量 和 合计 容量 。 

口 ”-permstat: 以 ClassLoader 为 统计 口径 显示 永久 代 内 存 状 态 ， 只 在 Linux/Solaris 平 
台 下 有 效 。 

口 “-F: 当 虚 拟 机 进程 对 -dump 选项 没有 响应 时 ， 可 使 用 这 个 选项 强制 生成 dump 快 
照 ， 只 在 Linux/Solaris 平台 下 有 效 。 

例如 在 下 面 的 命令 中 ， 演 示 了 使 用 jmap 生成 一 个 正在 运行 的 Eclipse 的 dump 快照 文 

件 的 例子 。 


C:\Users\IcyFenix>jmap -dump:format=b, file=eclipse.bin 3500 
Dumping heap to C:\Users\IcyFenix\eclipse.bin... 
Heap dump file created 


其 中 上 述 代码 中 的 “3500” 是 通过 jps 命令 查询 到 的 LVMID。 


9.1.5 jhat: 虚拟 机 堆 转 储 快照 分 析 工 具 


JDK 提供 了 jhat (JVM Heap Analysis TooD) 命 令 与 jmap 搭配 使 用 ， 来 分 析 jmap 生成 的 
堆 转 储 快照 。jhat 内 置 了 一 个 微型 的 HTTP/HTML 服务 器 ， 生 成 dump 文件 的 分 析 结果 
后 ， 可 以 在 浏览 器 中 查看 。 不 在 实际 工作 中 ， 除 非 笔者 手 上 真 的 没有 别 的 工具 可 用 ， 否 则 
一 般 都 不 会 去 直接 使 用 jhat 命令 来 分 析 dump 文件 ， 主 要 原因 有 二 : 一 是 一 般 不 会 在 部 署 
应 用 程序 的 服务 器 上 直接 分 析 dump 文件 ， 即 使 可 以 这 样 做 ， 也 会 尽量 将 dump 文件 复制 
到 其 他 机 器 上 进行 分 析 ， 因 为 分 析 工作 是 一 个 耗 时 而 且 消 耗 硬件 资源 的 过 程 ， 既 然 都 要 在 
其 他 机 器 上 进行 ， 就 没 必要 受到 命令 行 工具 的 限制 了 ; 另外 一 个 原因 是 jhat 的 分 析 功 能 相 
对 来 说 比较 简陋 ， 所 以 一 般 会 使 用 VisuaIVM 以 及 专业 地 用 于 分 析 dump 文件 的 Eclipse 
Memory Analyzer、IBM HeapAnalyzer 等 工具 ， 都 能 实现 比 jhat 更 强大 、 更 专业 的 分 析 功 
能 。 下 面 的 代码 演示 了 使 用 jhat 分 析 上 一 节 采 用 jmap 生成 的 Eclipse IDE 的 内 存 快照 
文件 。 

例如 ， 下 面 的 命令 演示 了 使 用 jhat 分 析 dump 文件 的 用 法 。 


C: \Users\IcyFenix>jhat eclipse.bin 

Reading from eclipse.bin... 

Dump file created Fri Nov 19 22:07:21 CST 2010 
Snapshot read, resolving... 

Resolving 1225951 OQbjects... 

Chasing references, expect 245 dots.... 
Eliminating duplicate references... 

Snapshot resolved. 

Started HTTP server on port 7000 

Server is ready. 


当 屏 幕 显 示 “Server is ready.” 的 提示 后 ， 用 户 在 浏览 器 中 输入 “http://localhost:7000/” 
就 可 以 看 到 分 析 结果 。 分 析 结 果 默 认 以 包 为 单位 进行 分 组 显示 ， 分 析 内 存 泄 露 问题 主要 会 使 
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用 到 其 中 的 “Heap Histogram”( 与 jmap-histo 功能 一 样 ) 与 OQL 页 签 的 功能 ， 前 者 可 以 找 
到 内 存 中 总 容量 最 大 的 对 象 ， 而 后 者 是 标准 的 对 象 查询 语言 ， 使 用 类 似 SQL 的 语法 对 内 存 
中 的 对 象 进 行 查询 设计 。 


9.1.6 jstack: Java 堆栈 跟踪 工具 


jstack (Stack Trace for Java) 命 令 用 于 生成 虚拟 机 当前 时 刻 的 线程 快照 ， 一 般 称 为 
threaddump 或 javacore 文件 。 线 程 快照 就 是 当前 虚拟 机 内 每 一 条 线程 正在 执行 的 方法 堆栈 
的 集合 ， 生 成 线程 快照 的 主要 目的 是 定位 线程 出 现 长 时 间 停顿 的 原因 ， 如 线程 间 死 锁 、 死 
循环 、 请 求 外 部 资源 导致 的 长 时 间 等 待 等 ， 都 是 导致 线程 长 时 间 停 顿 的 常见 原因 。 

线程 出 现 停顿 的 时 候 通过 jstack 来 查看 各 个 线程 的 调用 堆栈 ， 就 可 以 知道 没有 响应 的 
线程 到 底 在 后 台 做 些 什么 事情 ， 或 者 等 待 着 什么 资源 。 

使 用 jstack 命令 的 格式 如 下 : 


jstack [option]vmid 


option 选项 的 合法 值 与 具体 含义 如 下 。 

口 “-F: 当 正 常 输出 的 请 求 不 被 响应 时 ， 强 制 输出 线程 堆栈 。 

口 ”-l: 除 堆栈 外 ， 显 示 关于 锁 的 附加 信息 。 

口 -m: 如 果 调 用 到 本 地 方法 的 话 ， 可 以 显示 C/C++ 的 堆栈 。 
例如 通过 下 面 的 命令 ,演示 了 使 用 jstack 查看 Eclipse 线程 堆栈 的 过 程 。 


C:\Users\IcyFenix>jstack -1 3500 
20.0~11- 1923 26 
Full thread dump Java HotSpot (TM) 69-Bit Server WM (17.1-b03 mixed mode): 
“[ThreadPool Manager] - Idle Thread" daemon pri0=6 tid=Ox0000000039dq4000 
nid=Oxfso in Object.wait() eOx000000003c96f000] 
java.lang.Thread.State: WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
- waiting on <Ox0000000016bdcc60> (a 
org.eclipse.equinox.internal .util.impl. 
tpt .threadpool .Executor) 
at java .lang.Object.wait (Object.java:485) 
at org.eclipse. equinox.internal .util.impl.tpt.threadpool. Executor. 
run (Executor.java:106) 
-locked< Ox0 00 00 00 016bqcc60> (a 
org.aclipse.equinox.internal .util.impl .tpt. 
threadpool .Executor) 
Locked ownable synchronizers: 
—- None 


在 上 述 命令 中 ，“3500” 是 通过 jps 命令 查询 到 的 LVMID。 

从 JDK 1.5 版 本 开始 ， 在 java.lang.Thread 类 新 增 了 一 个 getAlIStackTraces() 方 法 用 于 获 
取 虚 拟 机 中 所 有 线程 的 StackTraceElement 对 象 。 使 用 这 个 方法 可 以 通过 简单 的 几 行 代码 就 
完成 jstack 的 大 部 分 功能 ， 在 实际 项 目 中 不 妨 调用 这 个 方法 做 个 管理 员 页 面 ， 可 以 随时 使 
用 浏览 器 来 查看 线程 堆栈 ， 例 如 ， 下 面 是 查看 线程 状况 的 JSP 代码 。 


<%@ page import="”java.util.Map”s®> 
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<html> 

<head> 
<tit1le> 服 务 器 线程 信息 </title> 
</head> 

<body> 


for (Map.Entry<Thread, StackTraceElement[]> stackTrace:Thread. 
getAllSstackTraces() .entrySet()) { 
Thread thread= (Thread) stackTrace.getKey(); 


StackTraceElement[] stack= (StackTraceElement[]) stackTrace.getValue()J 
if( thread.equals (Thread. currentThread())) { 
continue: 


) 

out .print(”N\n 线程 : “+thread.getName ()+”\n"); 
for (StackTraceElement element : stack) { 
out.print ("\t"+element+"\n"); 

) 

) 

务 > 

</pre> 

</body> 

</html> 


9.2 JDK 的 可 视 化 工具 


JDK 中 除了 提供 大 量 的 命令 行 工具 外 ， 还 有 两 个 功能 强大 的 可 视 化 工具 : JConsole 和 
VisualVM， 这 两 个 工具 是 JDK 的 正式 成 员 。 其 中 JConsole 是 在 JDK 1.5 时 期 就 已 经 提供 的 
虚拟 机 监控 工具 ， 而 VisualVM 在 JDK 1.6 Update7 中 才 首 次 发 布 ， 现 在 已 经 成 为 Sun 
(Oracle) 主 力 推动 的 多 合 一 故障 处 理工 具 ， 并 且 已 经 从 JDK 中 分 离 出 来 成 为 可 以 独立 发 展 
的 开源 项 目 。 


9.2.1 JConsole: Java 监视 与 管理 控制 台 


JConsole (Java Monitoring and Management Console) 是 一 款 基于 JMX 的 可 视 化 监视 和 管 
理 的 工具 。 它 管理 部 分 的 功能 是 针对 JMX MBean 进行 管理 。JConsole 是 一 个 基于 JMX 的 
GUI 工具 ， 用 于 连接 正在 运行 的 JVM， 不 过 此 JVM 需要 使 用 可 管理 的 模式 启动 。 如 果 要 
把 一 个 应 用 以 可 管理 的 形式 启动 ， 可 以 在 启动 是 设置 com.sun.management.jmxremote。 例 
如 ， 启 动 一 个 可 以 在 本 地 监控 的 J2SE 的 应 用 Java2Demo， 需 输入 以 下 命令 : 


JDK HOME/bin/java -Dcom.sun-management .Jjmxremote -jar 
[b] JDK_HOME/demo/jfc/Java2D/Java2Demo.jar 


由 于 MBean 可 以 使 用 代码 、 中 间 件 服务 器 的 管理 控制 台 或 者 所 有 符合 JMX 规范 的 软 
件 进 行 访 问 ， 所 以 本 节 中 将 会 着 重 介绍 JConsole 监视 部 分 的 功能 。 在 命令 行 中 输入 
“jconsole” 后 ， 如 果 弹 出 窗口 ， 则 说 明 配 置 可 用 。 
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1. 启用 JConsole 


通过 JDK/bin 目录 下 的 jconsole.exe 启动 JConsole 后 ， 然 后 ， 将 自动 搜索 出 本 机 运行 
的 所 有 虚拟 机 进程 ， 不 需要 用 户 自己 再 使 用 jps 来 查询 ， 如 图 9-8 所 示 。 


9-8 新建 连接 


在 “远程 进程 ”中 输入 “192.168.1.101:1090”， 单 击 “ 连 接 ” 按 钮 就 可 以 查看 到 远程 
Tomcat 服务 器 的 运行 情况 了 ， 如 图 9-9 所 示 。 
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境内 存 使 用 情况 


20 内 
1 内 
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图 9-9 ”Jconsole 主 界面 
在 图 9-9 所 示 的 启动 界面 中 ， 各 个 选项 卡 的 具体 说 明 如 下 : 
口 概述， 有 关 堆 内 存 使 用 情况 ， 线 程 ， 类 加 载 和 CPU 使 用 情况 的 综述 ; 
口 内存: 内 存 的 详细 情况 ， 堆 和 其 他 内 存 ; 
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线程 : 峰值 /活动 线程 ， 另 外 ， 各 个 线程 的 明细 信息 ， 检 测 死 锁 ; 
类 : 监控 加 载 和 仓 载 的 类 ; 

VM 摘要 : 有 关 vm 的 明细 信息 ; 

MBean: 当前 Java 程序 的 MBean( 如 果 有 的 话 ) 的 操作 。 

MBean 选项 卡 展示 了 所 有 以 一 般 形式 注册 到 JVM 上 的 MBeans。MBeans tab 允许 你 
获取 所 有 的 平台 信息 ， 包 括 那些 不 能 从 其 他 选项 卡 获取 到 的 信息 。 注 意 ， 其 他 选项 卡 上 的 
一 些 信息 也 在 MBeans 这 里 显示 。 另 外 ， 你 可 以 使 用 MBeans 选项 卡 管理 你 自己 的 应 用 
Mbeans 。 


2. 使 用 MBean 标签 监控 和 管理 MBean 
注册 到 JMX 代理 的 平台 或 者 应 用 的 MBean， 可 以 通过 MBean 标签 获取 。 例 如 下 面 是 
内 存 的 MBean 定义 。 


public interface MemoryMXxBean { 
public MemoryUsage getHeapMemoryUsage(); 
public MemoryUsage getNonHeapMemoryUsage(); 


OOO DO 


public int getObjectPendingFinalizationCount (); 
public boolean isVverbose(); 
public void setVerbose (boolean value); 
public void gc(); 
1 
内 存 的 MBean 包括 如 下 4 个 属性 : 


口 HeapMemoryUsage: 用 于 描述 当前 堆 内 存 使 用 情况 的 只 读 属性 。 

口 NonHeapMemoryUsage: 用 于 描述 当前 的 非 堆 内 存 的 使 用 情况 的 只 读 属性 。 

口 ”ObjectPendingFinalizationCount: 用 于 描述 有 多 少 对 象 被 挂 起 以 便 回收 。 

口 Verbose: 用 于 动态 设置 GC 是 否 跟着 详细 的 堆栈 信息 ， 为 一 个 布尔 变量 。 

内 存 的 MBean 支持 一 个 操作 一 一 GC， 此 操作 可 以 发 送 进 行 实时 的 垃圾 回收 请 求 。 
MBean 选项 卡 如 图 9-10 所 示 。 


弟 后 答 ,。 sg 机 开放 ， 
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左边 的 树 形 结构 以 名 字 的 方式 展示 了 所 有 MBean 的 列表 。 一 个 MBean 对 象 的 名 字 由 
一 个 域 的 名 字 和 一 串 关 键 字 属 性 组 成 。 例 如 ，JVM 的 平台 的 MBean 是 在 java.lang 域 下 的 
一 组 ， 而 日 志 的 MBeans 则 在 javautillogging 域 下 。MBean 对 象 的 名 字 在 
javax.management.ObjectName 规范 中 定义 。 
当 我 们 在 树 中 选中 一 个 MBean， 属 性 、 操 作 或 者 通知 等 一 些 信息 会 再 右边 显示 出 来 ， 
如 果 属 性 是 可 写 的 (属性 被 标志 为 蓝 色 ) 则 可 以 进行 设置 。 图 9-11 是 MBean 的 操作 界面 。 
图 Jara 故 祝 和 管理 控制 台 - 192. 168. 1. 101:1090 
EEEEEEI 
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9-11 MBean 的 操作 界面 
MBean 的 通知 界面 如 图 9-12 所 示 。 


图 9-12 MBean 的 通知 界面 


此 时 也 可 以 看 到 由 MBean 发 送出 来 的 通知 : 默认 情况 ， 如 果 你 不 订阅 通知 的 话 ， 
JConsole 不 会 收 到 MBean 发 生 过 来 的 通知 。 可 以 单 击 “ 订 阅 ” 按 钮 来 通知 进行 定义 ， 使 用 


“未 订阅 ”按钮 可 以 取消 订阅 。 
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3. 监控 内 存 


内 存 标签 页 通过 读 取 内 存 系统 、 内 存 池 、 垃 圾 回收 的 MBean 来 获取 对 内 存 消 耗 、 内 
存 池 、 垃 圾 回收 情况 的 统计 。 监 控 内 存 的 界面 如 图 9-13 所 示 。 


图 Jnva 监视 和 管理 控制 古 


9-13 ”监控 内 存 界面 


图 9-13 展示 了 内 存 随时 间 变 化 的 使 用 情况 。 有 对 堆 的 、 非 堆 的 以 及 特殊 内 存 池 的 统 
计 。 内 存 池 信 息 是 否 能 被 获取 ， 取 决 于 使 用 的 Java 虚拟 机 。 下 面 列表 展示 了 HotSpot 虚拟 
机 的 内 存 池 情 况 。 

口 内存 池 “Eden Space”(heap): 内 存 最 初 从 这 个 线程 池 分 配给 大 部 分 对 象 。 

口 ” 内 存 池 “Survivor Space”(heap): 用 于 保存 在 eden space 内 存 池 中 经 过 垃圾 回收 

后 没有 被 回收 的 对 象 。 
口 “ 内 存 池 “Tenured Generation”(heap): 用 于 保持 已 经 在 survivor space 内 存 池 中 存 
在 了 一 段 时 间 的 对 象 。 
口 内 存 池 “Perm Generation”(non-heap): 用 于 保存 虚拟 机 自己 的 静态 (refective) 数 
据 ， 例 如 类 (class) 和 方法 (method) 对 象 。Java 虚拟 机 共享 这 些 类 数据 。 这 个 区 域 被 
分 割 为 只 读 的 和 只 写 的 。 
口 “ 内 存 池 “Code Cache”(non-heap): HotSpot Java 虚拟 机 包括 一 个 用 于 编译 和 保存 
本 地 代码 (Native Code) 的 内 存 ， 叫 做 “代码 缓存 区 ”(Code Cache)， 详 细 信 息 区 域 
列 出 了 一 些 当前 线程 的 信息 ， 例 如 : 
> 已 使 用 : 当前 的 内 存 使 用 量 。 使 用 的 内 存 包括 所 有 对 象 (能 被 获取 和 不 能 被 获 
取 的 ) 所 占用 的 内 存 。 

> ”分配 : Java 虚拟 机 保证 能 够 获取 到 的 内 存量 。 分 配 内 存 (Committed Memory) 
的 量 可 能 随时 间 改 变 。Java 虚拟 机 可 能 释放 部 分 这 里 的 内 存 给 系统 ， 相 应 的 
分 配 的 内 存 这 时 可 能 少 于 初始 化 时 分 配 的 给 它 的 量 。 分 配 量 总 数 大 于 或 等 于 
已 使 用 的 内 存量 。 

> 最 大 值 ， 内 存 管 理 系 统 可 以 使 用 的 最 大 内 存量 。 这 个 值 可 以 被 改变 或 者 不 做 
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设 定 。 如 果 JVM 试图 增加 使 用 的 内 存 到 大 于 分 配 量 (Committed Memory) 的 
情况 ， 内 存 分配 可 能 失败 ， 即 便 想 使 用 的 内 存量 小 于 或 者 等 于 最 大 值 ， 例 如 
系统 虚拟 内 存 比 较 低 时 。 
“内 存 ” 选 项 卡 相当 于 可 视 化 的 jstat 命令 ， 用 于 监视 受 收集 器 管理 的 虚拟 机 内 存 (Java 
堆 和 永久 代 ) 的 变化 趋势 。 接 下 来 通过 下 面 的 代码 来 体验 一 下 它 的 监视 功能 。 运 行 时 设置 的 
虚拟 机 参数 为 -XmslOOm -XmxlOOm -XX:+UseSerialGC， 这 段 代 码 的 作用 是 以 64KB/50 毫 
秒 的 速度 往 Java 堆 中 填充 数据 ， 一 共 填 充 1000 次 ， 使 用 JConsole 的 “内 存 ” 选 项 卡 进行 
监视 ， 观 察 曲 线 和 柱状 指示 图 的 变化 。 


static class OOMObject { 
public byte[] placeholder=new byte [64x*102417 
) 
public static void fillHeap(int num) throws InterruptedException{ 
List<ooMobject> list=new 人 
for (int i=oj i<num; i++) 
// 稍 作 延 时 ， 从 几 视 曲线 的 变化 更 加 明 旺 
Thread.sleep (50); 
list.add (new OOMObject ()); 
} 
System.gc()， 
} 


public static void main(String[] args) throws Exception { 
fillHeap (1000)， 
} 


其 中 对 于 内 存 占 位 符 对 象 来 说 ， 一 个 OOMObject 大 约 占 64K。 
4. 开启 /关闭 虚拟 机 的 详细 跟踪 


如 上 所 述 ， 内 存 系 统 的 MBean 定义 了 一 个 叫做 Verbose 布尔 变量 ， 让 你 能 动态 地 打开 
或 关闭 详细 的 GC 跟踪 。 详 细 的 GC 跟踪 ， 将 会 在 JVM 启动 时 显示 。 默 认 的 HotSpot 的 
GC 详细 输出 为 stdout。 设 置 Verbose GC 的 界面 如 图 9-14 所 示 。 
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9.2.2 VisualVM: 多 合 一 故障 处 理工 具 


VisualVM 提供 在 Java 虚拟 机 (Java Virutal Machine, JVM) 上 运行 的 Java 应 用 程序 的 详 
细 信 息 。 在 VisualVM 的 图 形 用 户 界面 中 ， 我 们 可 以 方便 、 快 捷 地 查看 多 个 Java 应 用 程序 
的 相关 信息 。 

简单 说 来 ，VisualVM 是 一 种 集成 了 多 个 JDK 命令 行 工具 的 可 视 化 工具 ， 它 能 为 您 提 
供 强大 的 分 析 能 力 。 所 有 这 些 都 是 免费 的 ! 它 襄 括 的 命令 行 工 具 包括 jstat、JConsole、 
jstack、jmap 和 jinfo， 这 些 工具 与 JDK 的 标准 版 本 是 一 致 的 。 可 以 使 用 VisualVM 生成 和 
分 析 海 量 数据 、 跟 踪 内 存 泄露 、 监 控 垃圾 回收 器 、 执 行内 存 和 CPU 分 析 ， 同 时 它 还 支持 
在 MBeans 上 进行 浏览 和 操作 。 尽 管 VisualVM 自身 要 在 JDK 6 这 个 版 本 上 运行 ， 但 是 
JDK1.4 以 上 版 本 的 程序 它 都 能 监控 。 

VisuaIVM 是 到 目前 为 止 ， 随 JDK 发 布 的 功能 最 强大 的 运行 监视 和 故障 处 理 程序 ， 并 
且 可 以 预见 在 未 来 一 段 时 间 内 都 是 官方 主力 发 展 的 虚拟 机 故障 处 理工 具 。 官 方 在 
VisuaIVM 的 软件 说 明 中 写 上 了 “All-in-One” 的 描述 字样 ， 预 示 着 它 除了 运行 监视 、 故 障 
处 理 外 ， 还 提供 了 很 多 其 他 方面 的 功能 。 如 性 能 分 析 (Profiling)，VisualVM 的 性 能 分 析 功 
能 甚至 比 起 JProfiler、YourKit 等 专业 且 收 费 的 Profiling 工具 都 不 会 逊色 多 少 ， 而 且 
VisualVM 的 还 有 一 个 很 大 优点 : 不 需要 被 监视 的 程序 基于 特殊 Agent 运行 ， 因 此 它 对 应 用 
程序 的 实际 性 能 的 影响 很 小 ， 使 得 它 可 以 直接 应 用 在 生产 环境 中 。 这 个 优点 是 JProfiler、 
YourKit 等 工具 无 法 与 之 媲美 的 。 


1. 安装 VisualVM 


(1) 从 VisualVM 项 目 页 下 载 VisualVM 安装 程序 。 
(2) 将 VisualVM 安装 程序 解压 缩 到 本 地 系统 。 
(3) 导航 至 VisualVM 安装 目录 的 bin 目录 ， 然 后 启动 应 用 程序 。 


2. 使 用 “应 用 程序 ”窗口 


在 启动 应 用 程序 后 会 打开 VisualVM 的 主 窗口 。 在 默认 情况 下 ，“ 应 用 程序 ”窗口 显 
示 在 主 窗 口 的 左 窗 格 中 。 在 “应 用 程序 ”窗口 中 ， 可 以 快速 查看 本 地 和 远程 YM 上 运行 
的 Java 应 用 程序 ， 如 图 9-15 所 示 。 


;应 用 程 床 FIED 
区 下 二 
人 vsuavM 
es 
二;i 打开 (OO) 
晶 旺 规程 Dump 
堆 Dump(H) 
性 能 分 析 (P) 
应 用 程序 快照 (A) 


在 出 现 OOME 时 生成 堆 Dump() 
图 9-15 “应 用 程序 ”窗口 
“应 用 程序 ”窗口 是 查看 特定 应 用 程序 详细 信息 的 主 入 口 点 。 右 键 单 击 应 用 程序 节点 
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将 打开 快捷 菜单 ， 从 中 可 以 选择 是 打开 主 应 用 程序 标签 ， 还 是 生成 线程 dump 或 堆 
dump。 
3. 浏览 堆 Dump 


VisualVM 有 一 个 可 视 化 窗口 ， 通 过 该 窗口 可 以 轻松 浏览 堆 dump。 您 可 以 装 入 现 有 
堆 dump， 或 为 本 地 运行 的 应 用 程序 生成 堆 快照 。 

要 生成 本 地 应 用 程序 的 堆 dump， 可 以 执行 下 列 任 一 操作 : 

(1) 在 “应 用 程序 ”窗口 中 右键 单 击 应 用 程序 节点 ， 然 后 选择 “ 堆 Dump”。 

(2) 在 “应 用 程序 ”窗口 中 双击 应 用 程序 节点 以 打开 应 用 程序 选项 卡 ， 然 后 在 “ 监 
视 ” 选 项 卡 中 单 击 “ 堆 Dump”。 

要 打开 保存 的 堆 dump， 请 从 主 菜单 中 选择 “文件 ”一 “ 装 入 ”命令 ， 然 后 找到 保存 
的 堆 dump， 如 图 9-16 所 示 。 浏 览 打开 的 堆 dump 的 流程 如 下 : 

(1) 单 击 “ 堆 Dump” 工 具 栏 中 的 “类 ”， 以 查看 活动 类 和 对 应 实例 的 列表 。 

(2) 双击 某 个 类 名 打开 “实例 ”视图 ， 以 查看 实例 列表 。 

(3) 从 列表 中 选择 某 个 实例 ， 以 查看 对 该 实例 的 引用 。 
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图 9-16 浏览 打开 的 堆 dump 


在 生成 堆 dump 后 ，VisualVM 将 在 新 标签 中 打开 该 堆 dump， 并 在 “应 用 程序 ” 窗 
口中 的 应 用 程序 节点 下 为 该 堆 dump 创建 一 个 节点 。 要 保存 生成 的 堆 dump， 请 右键 单 击 
该 堆 dump 节点 ， 然 后 选择 “另存 为 ”命令 。 如 果 没 有 明确 保存 生成 的 堆 dump， 则 在 应 
用 程序 关闭 时 将 删除 该 dump。 

4. 分 析 对 应 用 程序 进行 性 能 

VisualVM 包括 一 个 Profiler， 可 以 使 用 它 对 本 地 JVM 上 运行 的 应 用 程序 进行 性 能 分 
析 。 您 可 以 在 应 用 程序 标签 的 Profiler 选项 卡 中 访问 性 能 分 析 控 件 。 通 过 该 Profiler， 可 以 
分 析 本 地 应 用 程序 的 内 存 使 用 情况 和 CPU 性 能 。 

(1) 启动 本 地 Java 应 用 程序 。( 使 用 -Xshare:off 参数 启动 该 应 用 程序 。) 
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(2) 在 “应 用 程序 ”窗口 的 “本 地 ”节点 下 ， 右 键 单 击 该 应 用 程序 节点 ， 然 后 选择 
“打开 ”命令 以 打开 该 应 用 程序 标签 。 
(3) 在 该 应 用 程序 窗口 中 单 击 Profiler 标签 。 
(4) 在 Profiler 选项 卡 中 单 击 “ 内 存 ” 或 CPU 按钮 ， 在 选择 性 能 分 析 任 务 后 ，VisualVM 
将 在 Profiler 选项 卡 中 显示 性 能 分 析 数 据 。 
性 能 分 析 界面 如 图 9-17 所 示 。 
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图 9-17 性 能 分 析 界 面 


注意 : 要 对 JDK 6 上 运行 的 应 用 程序 进行 性 能 分 析 ， 需 要 关闭 该 应 用 程序 的 类 共 
享 ， 否 则 该 应 用 程序 可 能 会 衣 溃 。 要 关闭 类 共享 ， 请 使 用 -Xshare:off 参数 启动 应 用 
程序 。 

5. 连接 到 远程 主机 


通过 VisualVM 可 以 轻松 监视 远程 主机 上 运行 的 应 用 程序 ， 并 查看 有 关 远 程 系统 的 常 
规 数 据 。 要 查看 远程 主机 上 应 用 程序 的 相关 信息 ， 必 须 首 先 连 接 到 远程 主机 。 已 连接 的 远 
程 主机 将 列 在 “应 用 程序 ”窗口 的 “远程 ”节点 下 。 展 开 远程 主机 节点 可 查看 远程 主机 上 
运行 的 应 用 程序 。 

要 从 远程 应 用 程序 中 检索 数据 ， 需 要 在 远程 VM 上 运行 jstatd 实用 程序 。 无 法 对 远 
程 主机 上 运行 的 应 用 程序 进行 性 能 分 析 。 

(1) 右键 单 击 “ 应 用 程序 ”窗口 中 的 “远程 ”节点 ， 然 后 选择 “添加 远程 主机 ”。 

(2) 在 “添加 远程 主机 ”对 话 框 中 ， 输 入 远程 计算 机 的 主机 名 或 卫 地 址 。( 可 选 ) 输 入 
远程 主机 的 显示 名 称 。 此 名 称 将 显示 在 “应 用 程序 ”窗口 中 。 如 果 没 有 输入 显示 名 称 ， 则 
在 “应 用 程序 ”窗口 中 使 用 主机 名 标识 远程 主机 。 

(3) 单 击 “ 确 定 ”按钮 。 

单 击 “确定 ”按钮 后 ， 将 在 “远程 ”节点 下 显示 远程 主机 的 节点 。 展 开 远程 主机 节点 
可 查看 远程 主机 上 运行 的 Java 应 用 程序 。 

我 们 可 以 双击 远程 “应 用 程序 ”的 名 称 ， 在 VisualVM 中 打开 该 “应 用 程序 ”标签 。 
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“应 用 程序 ”界面 如 图 9-18 所 示 。 


;应 用 程序 EE 
日 古本 地 
息 java2d.JavazDemo (pd 1052) 
veuam 


已 区 remote_host 
图 NetBeans 6.0 pd 17870) 
起 Jstatd (pid 17546) 


出 tm 


图 9-18 ”应 用 程序 界面 


6. 安装 VisualVM 插件 


通过 安装 VisualVM 更 新 中 心 提 供 的 插件 ， 可 以 向 VisualVM 添加 功能 。 例 如 ， 安 
装 VisualVM-MBeans 插件 可 以 向 “应 用 程序 ”窗口 中 添加 MBean 选项 卡 ， 通 过 此 选项 
卡 ， 可 以 在 VisualVM 内 监视 和 管理 MBean。 

安装 VisualVM 插件 的 流程 如 下 。 

(1) 从 主 菜单 中 选择 “工具 ”一 “插件 ”。 

(2) 在 “可 用 插件 ”标签 中 ， 选 中 该 插件 的 “安装 ” 复 选 框 ， 单 击 “ 安 装 ”。 

(3) 逐步 完成 插件 安装 程序 。 

插件 界面 如 图 9-19 所 示 。 在 此 界面 中 显示 了 选中 VisualVM-MBeans 插件 的 “插件 ” 


管理 器 。 
EE 了 I Ls 
[El] at (1 [ERR [ESE [| 
重新 站 入 日 录 B) | 寺 罕 {) : 
二 2 加 VisuaVM-Glassfish 
回 。 ViauayMExensions Patform 人 社区 提供 的 所 
同 ys 曙 各 社区 提供 的 括 件 
回 vaaw-xcosoke Tooks 版 本 : 1.2 
回 vauavMBeans Taok 名 || 作者: Jamesav Badork 
回 vamcc Toals 的 |: oo27 
加 ssmay Tools 例 。 || 沽 : Vea 抽 4 中 必 
alapplcaton Took 耸 所 : 
回 vee es Teo 的 
回 vauavw4ogfle-Modue 。 尾 撮 “| 插件 描述 
回 visaMM-TDA Module 竺 多 
Asorghe puer guy er over vew of odenced mavtorng 


图 9-19 ”插件 界面 


本 节 只 是 简单 介绍 了 VisualVM 的 某 些 功能 ，VisualVM 由 在 提供 一 个 直观 的 可 视界 
面 ， 使 我 们 可 以 轻松 浏览 有 关 本 地 和 远程 JVM 上 运行 的 Java 应 用 程序 的 信息 。 有 关 使 
用 VisualVM 功能 的 更 多 详细 信息 ， 读 者 可 以 从 http://visualvm.java.net/docindex.html 
获取 。 


_JVM 参数 分 析 和 调 优 实战 


前 面 介绍 了 处 理 Java 虚拟 机 内 存 问题 的 知识 与 工具 ， 本 章 将 讲解 常用 
JVM 参数 的 基本 知识 ， 并 与 读者 分 享 几 个 比较 有 代表 性 的 实际 案例 。 考 虑 到 虚 
拟 机 故障 处 理 和 调 优 主要 面向 各 类 服务 端 应 用 ， 而 大 部 分 Java 程序 员 较 少 有 
机 会 直接 接触 生产 环境 的 服务 器 ， 因 此 本 章 还 准备 了 一 个 所 有 开发 人 员 都 能 够 


进行 “亲身 实战 ”的 练习 ， 希 望 通过 实践 能 使 读者 获得 故障 处 理 和 调 优 的 
经 验 。 


间 后 区 ,see 机 开放 ， 
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10.1 捕 鱼 工具 选择 一 一 JVM 参数 


本 节 讲 解 的 JVM 参数 和 内 存 管理 有 关 ， 例 如 和 可 分 配 内 存 、 非 堆 内 存 和 堆 内 存 等 有 


10.1.1 通用 的 JVM 参数 


通用 的 JVM 参数 如 下 。 

(1) -server: 如 果 不 配置 该 参数 ，JVM 会 根据 应 用 服务 器 硬件 配置 自动 选择 不 同 模 
式 ，server 模式 启动 比较 慢 ， 但 是 运行 期 速度 得 到 了 优化 ， 适 合 于 服务 器 端 运行 的 JVM。 

(2) -client: 启动 比较 快 ， 但 是 运行 期 响应 没有 server 模式 的 优化 ， 适 合 于 个 人 PC 的 
服务 开发 和 测试 。 

(3) -Xmx: 设置 java heap 的 最 大 值 ， 默 认 是 机 器 物理 内 存 的 1/4。 这 个 值 决定 了 最 多 
可 用 的 Java 堆 内 存 : 分 配 过 少 就 会 在 应 用 中 需要 大 量 内 存 作 缓存 或 者 临时 对 象 时 出 现 
OOM(Out Of Memory) 的 问题 ， 如 果 分 配 过 大 ， 那 么 就 会 因 PermSize 过 小 而 引起 的 另外 一 
种 Out Of Memory。 所 以 如 何 配 置 还 是 根据 运行 过 程 中 的 分 析 和 计算 来 确定 ， 如 果 不 能 确 
定 还 是 采用 默认 的 配置 。 

(4) -Xms: 设置 Java 堆 初 始 化 时 的 大 小 ， 默 认 情 况 是 机 器 物理 内 存 的 1/64。 这 个 主要 
是 根据 应 用 启动 时 消耗 的 资源 决定 ， 分 配 少 了 申请 起 来 会 降低 运行 速度 ， 分 配 多 了 也 
浪费 。 

(5) -XX:PermSize: 初始 化 永久 内 存 区 域 大 小 。 永 久 内 存 区 域 全 称 是 Permanent 
Generation space， 是 指 内 存 的 永久 保存 区 域 ， 程 序 运行 期 不 对 PermGen space 进行 清理 ， 
所 以 如 果 你 的 APP 会 LOAD 很 多 CLASS 的 话 ， 就 很 可 能 出 现 PermGen space 错误 。 这 种 
错误 常见 在 web 服务 器 对 JSP 进行 pre compile 的 时 候 。 如 果 你 的 WEB APP 下 用 了 大 量 
的 第 三 方 jar， 其 大 小 超过 了 jvm 默认 的 PermSize 大 小 (4MD 那 么 就 会 产生 此 错误 信息 了 。 

(6) -XX:MaxPermSize: 设置 永久 内 存 区 域 最 大 大 小 。 

(7) -Xmn: 直接 设置 青年 代 大 小 。 整 个 JVM 可 用 内 存 大 小 = 青年 代 大 小 + 老年 代 大 
小 + 持久 代 大 小 。 持 久 代 一 般 固定 大 小 为 64m， 所 以 增 大 年 轻 代 后 ， 将 会 减 小 老年 代 大 
小 。 此 值 对 系统 性 能 影响 较 大 ，Sun 官方 推荐 配置 为 整个 堆 的 3/8。 按 照 Sun 的 官方 设置 比 
例 ， 则 上 面 的 例子 中 年 轻 代 的 大 小 应 该 为 2048*3/8=768M。 

(8) -XX:NewRatio: 控制 默认 的 Young 代 的 大 小 ， 例 如 ， 设 置 -XX:NewRatio=3 意味 
着 Young 代 和 老年 代 的 比率 是 1 : 3。 换 句 话说 ，Eden 和 Survivor 空间 总 和 是 整个 堆 大 小 
的 1/4。 

正如 图 10-1 中 所 示 的 实际 设置 ，-XX:NewRatio=2，-Xmx=2048， 则 年 轻 代 和 老年 代 的 
分 配 比例 为 1 : 2， 即 年 轻 代 的 大 小 为 682M， 而 老年 代 的 大 小 为 1365M。 查 看 实际 系统 的 
JVM 监控 结果 为 : 

口 ” 内 存 池 名 称 : Tenured Gen。 
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口 “Java 虚拟 机 最 初 向 操作 系统 请 求 的 内 存量 : 3 538 944 字 节 。 
Java 虚拟 机 实际 能 从 操作 系统 获得 的 内 存量 : 1 431 699 456 字 节 。 
口 “Java 虚拟 机 可 从 操作 系统 获得 的 最 大 内 存量 : 1 431 699 456 字 节 。 请 注意 ， 并 
不 一 定 能 获得 该 内 存量 。 
口 Java 虚拟 机 此 时 使 用 的 内 存量 : 1 408 650 472 字 节 ， 即 1 408 650 472 字 节 
=1365M， 这 证 明了 上 面 的 计算 是 正确 的 。 
到 -XK-UseParallelGC 


口 


-Server 


-Djava.endorsed.dirs=${com.sun.aas.installRoot}lib/endorsed 


-Djava.security.policy=${com.sun.aas.instanceRootyconfig/server.policy 


-Djava,security.auth.login.config=${com.sun.aas.instanceRootyconfig/ogi 


-Dsun.rmi.dgc.server.gcinterval=3600000 


-Dsun midge client gcinterval= 3600000 
口 mc048m 


-Djavax.net.ssl.keyStore=${com.sun.aas.instanceRootyconfig/keystore jks 


-Djavax net ssl.trustStore=${com.sun.aas.instanceRoot}yconfig/cacerts jks 


-Djava.ext.dirs=${com.sun.aas.javaRoot}ylib/ext${path.separator}${com.su 
-Djdbc.drivers=org.apache.derbyjdbc.ClientDriver 


-Djavacmanagementbuilderinitial=com.sun.enterprise.admin.servercort 


-Deom.sun.enterprise.config.config_environment_factory_class=com.sun, 


-Deom.sun.enterprise taglibs=appserv-jstl jarjsfimpljar 


口 -Dcom.sun.enterprisetaglisteners=jsfimpljar 
-XNewRatio=2 


10-1 参数 设置 界面 


(9) -XX:SurvivorRatio: 设置 年 轻 代 中 Eden 区 与 Survivor 区 的 大 小 比值 。 设 置 为 4， 
则 两 个 Survivor 区 与 一 个 Eden 区 的 比值 为 2 : 4， 一 个 Survivor 区 占 整 个 年 轻 代 的 116。 越 
大 的 survivor 空间 可 以 允许 短期 对 象 尽量 在 年 青 代 消亡 ， 如 果 Survivor 空间 太 小 ，Copying 
收集 将 直接 将 其 转移 到 老年 代 中 ， 这 将 加 快 老年 代 的 空间 使 用 速度 ， 引 发 频繁 的 完全 垃圾 
回收 。 例 如 在 图 10-2 中 ，SurvivorRatio 的 值 设 为 3，Xmn 为 768M， 则 每 个 Survivor 空间 
的 大 小 为 768M/5=153.6M。 


<jvm-options>-Xmn768M</jvm-options> 
<jvm-options>-XX:SurvivorRatio=3</jvm-options> 


图 10-2 设置 -XX:SurvivorRatio 的 值 
(10) -XX:NewSize: 为 了 实现 更 好 的 性 能 ， 您 应 该 对 包含 短期 存活 对 象 的 池 的 大 小 进 
行 设置 ， 以 使 该 池 中 的 对 象 的 存活 时 间 不 会 超过 一 个 垃圾 回收 循环 。 新 生成 的 池 的 大 小 由 
NewSize 和 MaxNewSize 参数 确定 。 通 过 这 个 选项 可 以 设置 Java 新 对 象 生产 堆 内 存 。 在 


通常 情况 下 这 个 选项 的 数值 为 1024 的 整数 倍 ， 并 且 大 于 1MB。 这 个 值 的 取 值 规 则 为 ， 一 
般 情况 下 这 个 值 -XX:NewSize 是 最 大 堆 内 存 (Maximum Heap Size) 的 1/4。 增 加 这 个 选项 值 
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的 大 小 是 为 了 增 大 较 大 数量 的 短 生命 周期 对 象 。 增 加 Java 新 对 象 生产 堆 内 存 相当 于 增加 了 
处 理 器 的 数目 。 并 且 可 以 并 行 地 分 配 内 存 ， 但 是 请 注意 内 存 的 垃圾 回收 却 是 不 可 以 并 行 处 
理 的 。 作 用 跟 -XX:NewRatio 相似 ，-XX:NewRatio 用 来 设置 比例 ， 而 -XX:NewSize 是 设置 
精确 的 数值 。 

(11) -XX:MaxNewSize: 通过 这 个 选项 可 以 设置 最 大 Java 新 对 象 生产 堆 内 存 。 通 常情 
况 下 这 个 选项 的 数值 为 1024 的 整数 倍 并 且 大 于 1MB， 其 功用 与 上 面 的 设置 新 对 象 生产 堆 
内 存 -XX:NewSize 相同 。 一 般 要 将 NewSize 和 MaxNewSize 设 成 一 致 。 

(12) -XX:MaxTenuringThreshold: 设置 垃圾 最 大 年 龄 。 如 果 设 置 为 0 的 话 ， 则 年 轻 代 
对 象 不 经 过 Survivor 区 ， 直 接 进 入 老年 代 。 对 于 老年 代 比 较 多 的 应 用 ， 可 以 提高 效率 。 如 
果 将 此 值 设置 为 一 个 较 大 值 ， 则 年 轻 代 对 象 会 在 Survivor 区 进行 多 次 复制 ， 这 样 可 以 增加 
对 象 在 年 轻 代 的 存活 时 间 ， 增 加 在 年 轻 代 即 被 回收 的 概率 。 例 如 在 图 10-3 中 ，-XX: 
MaxTenuringThreshold 参数 被 设置 成 S， 表 示 对 象 会 在 Survivor 区 进行 5 次 复制 后 如 果 还 
没有 被 回收 才 会 被 复制 到 老年 代 。 


<jvm-options>-XX:MaxTenuringThreshold=5</jvm-options> 
10-3 ”设置 垃圾 最 大 年 龄 


(13) -XX:GCTimeRatio: 设置 垃圾 回收 时 间 占 程序 运行 时 间 的 百分比 。 该 参数 设置 为 
n 的话 ， 则 垃圾 回收 时 间 占 程序 运行 时 间 百 分 比 的 公式 为 (1+n) ， 如 果 n=19 表示 java 可 
以 用 5% 的 时 间 来 做 垃圾 回收 ，1/(1+19)=1/20=5%。 

(14) -XX:TargetsurvivorRatio: 该 值 是 一 个 百分比 ， 控 制 允 许 使 用 的 救助 空间 的 比例 ， 
默认 值 是 50。 该 参数 设置 较 大 的 话 可 提高 对 survivor 空间 的 使 用 率 。 当 较 大 的 堆栈 使 用 较 
低 的 SurvivorRatio 时 ， 应 增加 该 值 到 80 一 90， 以 更 好 利用 救助 空间 。 

(15) -Xss: 设置 每 个 线程 的 堆栈 大 小 ， 根 据 应 用 的 线程 所 需 内 存 大 小 进行 调整 ， 在 相 
同 物理 内 存 下 ， 减 小 这 个 值 能 生成 更 多 的 线程 。 但 是 操作 系统 对 一 个 进程 内 的 线程 数 还 是 
有 限制 的 ， 不 能 无 限 生 成 ， 经 验 值 在 3000 一 5000 之 间 。 当 这 个 选项 被 设置 的 较 大 (>2MB) 
时 将 会 在 很 大 程度 上 降低 系统 的 性 能 。 因 此 在 设置 这 个 值 时 应 该 格外 小 心 ， 调 整 后 要 注意 
观察 系统 的 性 能 ， 不 断 调整 以 期 达到 最 优 。 

JDK5.0 以 后 每 个 线程 堆栈 大 小 为 1M， 以 前 每 个 线程 堆栈 大 小 为 256K。 

(16) -Xnoclassgc: 这 个 选项 用 来 取消 系统 对 特定 类 的 垃圾 回收 。 它 可 以 防止 当 这 个 类 
的 所 有 引用 丢失 之 后 ， 这 个 类 仍 被 引用 时 不 会 再 一 次 被 重新 装载 ， 因 此 这 个 选项 将 增 大 系 
统 堆 内 存 的 空间 。 禁 用 类 垃圾 回收 ， 性 能 会 高 一 点 。 


10.1.2” 串 行 收集 器 参数 
JVM 的 串 行 收集 器 参数 只 有 一 个 ， 即 -XX:+UseSerialGC， 功 能 是 设置 串 行 收集 器 。 


10.1.3 ”并 行 收 集 器 参数 
(1) -XX:+UseParallelGC:: 选择 垃圾 收集 器 为 并 行 收集 器 ， 此 配置 仅 对 年 轻 代 有 效 ， 
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即 上 述 配置 下 ， 年 轻 代 使 用 并 行 收集 ， 而 老年 代 仍 旧 使 用 串 行 收集 。 采 用 了 多 线程 并 行 管 
理 和 回收 垃圾 对 象 ， 提 高 了 回收 效率 ， 提 高 了 服务 器 的 吞吐 量 ， 适 合 于 多 处 理 器 的 服 
务 器 。 

(2) -XX:ParallelGCThreads: 配置 并 行 收集 器 的 线程 数 ， 即 : 同时 多 少 个 线程 一 起 进行 
垃圾 回收 。 此 值 最 好 配置 与 处 理 器 数目 相等 。 
(3) -XX:+UseParallelOldGC: 采用 对 于 老年 代 并 发 收集 的 策略 ， 可 以 提高 收集 效率 。 
JDK 6.0 支持 对 老年 代 并 行 收集 。 
(4) -XX:MaxGCPauseMillis: 设置 每 次 年 轻 代 并 行 收集 最 大 暂停 时 间 ， 如 果 无 法 满足 
此 时 间 ，JVM 会 自动 调整 年 轻 代 大 小 以 满足 此 值 。 

(5) -XX:+UseAdaptiveSizePolicy: 设置 此 选项 后 ， 并 行 收集 器 会 自动 选择 年 轻 代 区 大 
小 和 相应 的 Survivor 区 比例 ， 以 达到 目标 系统 规定 的 最 低 响 应 时 间或 者 收集 频率 等 ， 此 值 
建议 使 用 并 行 收集 器 时 ， 一 直 打开 。 


10.1.4 并 发 收集 器 参数 


(1) -XX:+UseConcMarkSweepGC: 指定 在 老年 代 使 用 concurrent cmark sweep gc。gc 
thread 和 app thread 并 行 (在 init-mark 和 remark 时 pause app thread)。app pause 时 间 较 
短 ， 适 合 交互 性 强 的 系统 ， 如 web server。 它 可 以 并 发 执行 收集 操作 ， 降 低 应 用 停止 时 
间 ， 同 时 它 也 是 并 行 处 理 模式 ， 可 以 有 效 地 利用 多 处 理 器 的 系统 的 多 进程 处 理 。 

(2) -XX:+UseParNewGC 指定 在 New Generation 使 用 parallel collector， 是 UseParallelGC 
的 gc 的 升级 版 本 ， 有 更 好 的 性 能 或 者 优点 ， 可 以 和 CMS gc 一 起 使 用 。 

(3) -XX:+UseCMSCompactAtFullCollection: 打开 对 老年 代 的 压缩 。 可 能 会 影响 性 能 ， 
但 是 可 以 消除 碎片 ， 在 FULL GC 的 时 候 ， 压 缩 内 存 ，CMS 是 不 会 移动 内 存 的 ， 因 此 ， 这 
个 非常 容易 产生 碎片 ， 导 致 内 存 不 够 用 ， 因 此 内 存 的 压缩 这 个 时 候 就 会 被 启用 。 增 加 这 个 
参数 是 个 好 习惯 。 

(4) -XX:+CMSIncrementalMode: 设置 为 增 量 模式 ， 适 用 于 单 CPU 情况 。 

(5) -XX:CMSFullGCsBeforeCompaction: 由 于 并 发 收集 器 不 对 内 存 空间 进行 压缩 、 整 
理 ， 所 以 运行 一 段 时 间 以 后 会 产生 “碎片 ”， 使 得 运行 效率 降低 。 此 值 设置 运行 多 少 次 
GC 以 后 对 内 存 空间 进行 压缩 、 整 理 。 

(6) -XX:+CMSClassUnloadingEnabled: 使 CMS 收集 持久 代 的 类 ， 而 不 是 fullgc。 

(7) -XX:+CMSPermGenSweepingEnabled: 使 CMS 收集 持久 代 的 类 ， 而 不 是 fullge。 

(8) -XX:-CMSParallelRemarkEnabled: 在 使 用 UseParNewGC 的 情况 下 ， 尽 量 减少 
mark 的 时 间 。 

(9) -XX:CMSInitiatingOccupancyFraction: 说 明 老年 代 到 百 分 之 多 少 满 的 时 候 开始 执行 
对 老年 代 的 并 发 垃圾 回收 (CMS)， 这 个 参数 设置 有 很 大 技巧 ， 基 本 上 满足 公式 : 


(Xmx-Xmn)* (100-CMSInitiatingOccupancyFraction) /100>=Xmn 


时 就 不 会 出 现 promotion failed。 在 我 的 应 用 中 Xmx 是 6000，Xmn 是 500， 那 么 Xmx-Xmn 
是 5500 兆 ， 也 就 是 老年 代 有 5500 兆 ，CMSInitiatingOccupancyFraction=90 说 明 老 年 代 到 
90% 满 的 时 候 开 始 执行 对 老年 代 的 并 发 垃圾 回收 (CMS)， 这 时 还 剩 10% 的 空间 是 
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5500*10%=550 兆 ， 所 以 即使 Xmn( 也 就 是 年 轻 代 共 500 兆 ) 里 所 有 对 象 都 搬 到 老年 代 里 ， 
550 兆 的 空间 也 足够 了 ， 所 以 只 要 满足 上 面 的 公式 ， 就 不 会 出 现 垃圾 回收 时 的 promotion 
failed， 如 果 按 照 “Xmx=2048.Xmn=768” 的 比例 计算 ， 则 CMSInitiatingOccupancyFraction 
的 值 不 能 超过 40， 否 则 就 容易 出 现 垃圾 回收 时 的 promotion failed。 

(10) -XX:+UseCMSInitiatingOccupancyOnly: 设置 只 有 在 老年 代 在 使 用 了 初始 化 的 比 
例 后 concurrent collector 启动 收集 。 

(11) -XX:SoftRefLRUPolicyMSPerMB: 相对 于 客户 端 模式 的 虚拟 机 (-client 选项 )， 当 
使 用 服务 器 模式 的 虚拟 机 时 (-server 选项 )， 对 于 软 引 用 (soft reference) 的 清理 力度 要 稍微 差 
一 些 。 可 以 通过 增 大 -XX:SoftRefLRUPolicyMSPerMB 来 降低 收集 频率 。 默 认 值 是 1000， 
也 就 是 说 每 秒 一 兆 字 节 。Soft reference 在 虚拟 机 中 比 在 客户 集中 存活 的 更 长 一 些 。 其 清除 
频率 可 以 用 命令 行 参数 -XX:SoftRefLRUPolicyMSPerMB=<N> 来 控制 ， 这 可 以 指定 每 兆 
堆 空闲 空间 的 soft reference 保持 存活 (一 旦 它 不 强 可 达 了 ) 的 毫秒 数 ， 这 意味 着 每 兆 堆 中 的 
空闲 空间 中 的 soft reference 会 (在 最 后 一 个 强 引用 被 回收 之 后 ) 存 活 1 秒 钟 。 注 意 ， 这 是 一 
个 近似 的 值 ， 因 为 soft reference 只 会 在 垃圾 回收 时 才 会 被 清除 ， 而 垃圾 回收 并 不 总 在 


发 生 。 

(12) -XX:LargePageSizeInBytes: 内 存 页 的 大 小 ， 不 可 设置 过 大 ， 会 影响 Perm 的 
大 小 。 

(13) -XX:+UseFastAccessorMethods: 原始 类 型 的 快速 优化 ，“get.set” 方 法 转 成 本 
地 代码 。 


(14) -XX:+DisableExplicitGC: 禁止 java 程序 中 的 full gc, 如 System.gc() 的 调用 。 
最 好 加 上 防止 程序 在 代码 里 误 用 了 ， 对 性 能 造成 冲击 。 

(15) -XX:+AggressiveHeap: 试图 使 用 大 量 的 物理 内 存 长 时 间 大 内 存 使 用 的 优化 ， 能 检 
查 计算 资源 (内 存 ， 处 理 器 数量 )， 至 少 需 要 256MB 内 存 。 

(16) -XX:+AggressiveOpts: 加 快 编译 。 

(17) -XX:+UseBiasedLocking: 锁 机 制 的 性 能 改善 。 


10.2 测试 调 优 


本 节 将 测试 被 测 系统 使 用 不 同 的 垃圾 回收 方案 时 的 性 能 表现 ， 了 解 各 种 JVM 参数 在 
性 能 调 优 时 的 实际 效果 ， 将 挑选 出 的 最 优 方 案 进 行 8 小 时 压力 测试 并 记录 测试 结果 。 


10.2.1 测试 环境 准备 


被 测 程序 运行 的 软 硬 件 环境 如 下 : 

口 D6304G 内 存 十 T7250 双核 CPU 十 160G 硬盘 ; 
口 ”操作 系统 : Windows XP SP3; 

OO IP: 11.55.15.51。 

被 测 程序 名 称 : 

XXX 局 采购 管理 系统 V1.1 版 。 
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程序 部 署 环境 : 
口 Tomcat 6.0.18 for Windows; 
口 SunJDK 1.6.13 for Windows; 
口 “”Oraclel0g for Windows( 单 独 运行 在 另外 一 台 640M 笔记 本 上 )。 
性 能 测试 工具 运行 的 软 硬 件 环境 : 
操作 系统 : Windows7; 
浏览 器 版 本 : IE 8; 
全 地 址 : 11.55.15.141; 
性 能 测试 工具 : Loadrunner 9.10。 
JVM 监控 工具 : 
使 用 Jconsole 进行 图 形 化 监控 。 
确定 JVM 在 被 测 系 统 的 机 器 上 最 大 可 用 内 存 : 
通过 在 命令 行 下 用 java -XmxXXXXM -version 命令 反复 测试 发 现在 11.55.15.51 机 器 
上 JVM 能 使 用 的 最 大 内 存 为 1592M， 如 图 10-4 所 示 。 


口 
口 
口 
已 


图 10-4 测试 最 大 内 存 


10.2.2 录制 测试 脚本 


在 录制 前 需要 修改 文件 checkcode.java， 将 随机 生成 的 校 验 码 改 成 一 个 固定 的 校 验 码 方 
便 脚 本 的 自动 运行 ， 然 后 将 编译 好 的 checkcode.class 文件 替换 发 布 包 中 的 class 文件 。 

选择 典型 业务 操作 进行 脚本 录制 ， 每 个 系统 的 典型 业务 操作 都 会 不 同 ， 需 要 经 过 分 析 
统计 ， 选 择 用 户 操作 频率 最 高 的 部 分 。 经 过 分 析 后 确定 的 脚本 内 容 为 : 录制 系统 登录 操作 
并 在 登录 成 功 后 的 主 界面 上 选取 一 段 文字 作为 验证 点 。 

启动 VuGen 程序 按 脚本 定义 内 容 进 行 录制 并 调试 脚本 ， 保 证 脚本 能 正常 运行 。 


10.2.3 定义 测试 场景 


虚拟 用 户 数 : 30。 

持续 运行 时 间 : 8 小 时 。 

虚拟 用 户 加 载 和 和 镍 载 方式 ， 同 时 。 

性 能 监控 指标 : 响应 时 间 、 香 吐 量 、 成 功 交 易 数 。 


所- 站 白白 


> EE 


odor, 


10.2.4 执行 初步 性 能 测试 
使 用 系统 默认 的 参数 执行 测试 ， 并 记录 响应 时 间 、 香 吐 量 已 经 成 功 交 易 数 等 数据 ， 同 
时 监控 JVM 的 使 用 情况 。 


10.2.5 选择 调 优 方案 
不 同 垃圾 回收 方法 测试 数据 如 表 10-1 所 示 。 


表 10-1 不 同 垃圾 回收 方法 测试 数据 
ld | NewRatio | SurviorRatio | TransResponse Time Throughput Passed Transactions 
1 2 25 3.139s 3016230.514 7528 
2 和 25 3.161s 2975581.301 7452 
3 3 25 2.814s 3334717.818 8383 
4 4 25 2.659s 3505592.450 8846 
到 本 25 2.860s 3270596.069 8232 
6 4 15 2.499s 3765121.986 9426 
4 5 1.986s 4750776.581 11843 
8 4 4 1.968s 4825608.161 11947 
9 4 3 3770420.243 9388 
10 |-XX:TargetSurvivorRatio=90 | 1.924 4945053.874 12216 
11 |-Xmx1024M 4974137.908 12360 
使 用 并 发 收集 模式 ， 运 行 10 分 钟 后 的 对 内 存 使 用 情况 如 图 10-5 所 示 。 
堆 内 存 使 用 情况 
400 mb 使 用 
«30 

300 Wb 

200 Mb 

100 Mb 

0.0 mh 


+ 
14:25 14:30 14:35 


已 使 用 : 371.9 Wb 已 提交 : 1.1 Gb 。 最 大 值 : 1.1 Gb 


图 10-5 并 发 收集 模式 下 的 堆 内 存 使 用 情况 


在 串 行 收集 模式 下 ， 运 行 10 分 钟 后 的 对 内 存 使 用 情况 如 图 10-6 所 示 。 
在 并 行 收集 模式 下 ， 运 行 10 分 钟 后 的 对 内 存 使 用 情况 如 图 10-7 所 示 。 
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措 诊 生 信用 策 光 堆 内 存 便 用 情况 
800 肌 od nk 
Too 600 Wb 
i Se 
5s00 Wb 
500 Wb 
400 Wm 
400 Wb 
300 Mb 2 
200 Wb Ge 
loo Wh 100 mb 
0.0 0.0mb A 
1 1 和 :4 i tss :0 605 610 
已 使 用 : 806.6 mp 。 已 提交 : 1.1 Gb 最 大 值 : 1.1 cb 已 使 用 : 527.7 Mb 已 提交 : 1.1 Gb 最 大 值 : 1.1 Gb 
10-6 ” 串 行 收集 模式 下 的 堆 内 存 使 用 情况 10-7 并行 收 集 模式 下 的 堆 内 存 使 用 情况 
30-60: 30 个 并 发 用 户 连续 运行 60 分 钟 的 JVM 内 存 变 化 截图 如 图 10-8 所 示 。 
入 进 扩 全 和 和 助 -ex 
8 下 | 训 香 [区 [ wm 扩 要 | wes] Ea 
Eo : [| tn: £m 可 执行 区 


:30 35 11:0 11: 枉 11:50 11:55 12:00 12:05 
003, 条 一 
上 一 
GC 时 间 : P5 MakSweep 2 项 收集 ) 所 用 的 时 间 为 4820 秒 EAS 
PS Scavenge ( 1,852 项 收集 ) 所 用 的 时 间 为 24.840 秘 La 


10-8 0 个 并 发 用 户 连 续 运行 60 分 钟 的 JVM 内 存 变化 截图 


在 11:36 和 11:56 分 发 生 了 两 次 完全 GC(Full GC)， 因 为 这 时 PS Old Gen 已 经 满 了 ， 
JVM 自动 对 Old Gen 中 的 内 存 进 行 了 回收 。 

根据 反复 的 测试 并 结合 被 测 系统 业务 特点 ， 最 终 决 定 使 用 以 下 最 优 方 案 进 行 8 小 时 压 
力 测 试 : 

JAVA OPTS=-server 


-Xms1024M 
—Xmzx1024M 


PT RT 淮 


fi vat 
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-Xmn128M 

—XX:NewSize=128M 
-XX:MaxNewSize=128M 

-XX: SurvivorRatio=20 
-XX:MaxTenuringThreshold=10 
-XX:GCTimeRatio=19 
—XX:+UseParNewGC 
-XX:+UseConcMarkSweepGC 
-XX:+CMSClassUnloadingEnabled 
-XX:+UseCMSCompactAtFullCollection 
-XX:CMSFul1GCsBeforeCompaction=0 
-XX:-CMSParallelRemarkEnabled 
-XX:CMSInitiatingOccupancyFraction=70 
-XX:SoftRefLRUPolicyMSPerMB=0 

—XX: PermSize=256m 
-XX:MaxPermSize=256m 

-Djava.awt .headless=true 


10.2.6 ” 调 优 后 JVM 监控 图 
30Vusers 运行 8 小 时 后 的 截图 界面 分 别 如 图 10-9 一 图 10-15 所 示 。 


概述 “内存 | 旺 程 | 类 | 摘要 | MBean PE" 
时 间 共 图: BE ~ 
堆 内 存 使 用 情况 病程 
900 mb -一 一 人 ath 
oy 
wl 
600 mi 
0 
3 
300 号 十 
| 加 
CT a 
00 网 
0:00 03:00 0%:00 0:00 03:00 06:00 
2009-05-21 2009-05-21 
已 合用: 167.5 Mb。 已 提交 : 1.1 Gb 。 最 大 值 :1.1 Gb 活动 : 67 。 峰值: 70 总计 132 
类 CPV 使 用 情况 
10, 000 80% 
+ | 
8,000 So 
sox 
30% 
20% 
6,000 十 
10% 
gry NW 
5,000 o% bi 
00:00 3.00 06:00 00:00 3:00 06:00 
2009-05-21 2009-05-21 
已 jn 工 : 8,694 。 未 加 载 : 28,807 。 总 计 ; 37,701 CP 使 用 依 况 -0 4 


10-9 第 一 个 时 间 段 的 堆 内 存 使 用 情况 
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[本 | | 二 要 | 类 | wm 摘要 | Wean| 


3 
配 : 局 执行 
ao mh 
so0 mh 
300 用 
Wm Wm dm Wom om Wom bo 


Tm 
02 二 
2 minutes | 

ConcunentMarkSweep ( 0 项 收集 ) 所 用 的 时 间 为 0.000 秘 ”i El 


10-10 ”第 二 个 时 间 段 的 堆 内 存 使 用 情况 


福村 内 存 [由 程 | 区 | Wi 摘要 | mso PF 
图 表 : | 内 存 池 “Pur Eden Spa 同时 间 范 围 : | 全 部 同 执行 多 
200 用 
150 用 
1o0 本 
| 
i I | J | 册 
| 
oo 
B00 M0 om mm 0 om 0 00 00 08:00 
2009-05-21 
详细 信息 
时 间 : 2009-05-21 082906 


和 
已 启用 : at7eszm 1 
分 配 :19, 168Kb | 
最 大 值 : 119, 168Kb 
GC 时 间 : ParNew( 9,865 项 收集 ) 所 用 的 时 间 为 。 2 ninutes A 
ConcunentMatkSweep《 0 项 收集 ) 所 用 的 时 间 为 0.000 秒 的 一 


图 10-11 内 存 池 Par Eden Space 使 用 情况 


EECESCR 


图 表 : | 内 存 池 “Par Survivor Space" 加 


时 间 范 围 : [全 部 


执行 gc 


30 用 


| 
,i 


详细 信息 


23:00 190:00 O100 ‘02:00 


04:00 


时 间 ; 2009-05-21 08.28:42 
已 评 用 : 1r8Kb 
分 配 : 。 5952I 
最 大 值 : 5,952Kb 


GC 时 间 : PaNew5 9865 项 收集 ) 所 用 的 时 间 为 


ConcunentMarkSweep( 0 项 收集 ) 所 用 的 时 间 为 


2 winates 


0.000 秒 


10-12 内存 池 Par Surviver Space 使 用 情况 


CCOEICEOCTR 


图 赛 ; [内 存 池 “CNS 014 Gen” ~ 


时 间 范围 ; | 全 部 


执行 


70m 


人 
0 


23:00 00:00 01:00 :0 
2009-05-21 


04:00 


时 间 : 2009.05-21 082938 
已 使 用 : 。 sa, Ts 区 

分 配 :917,s04 Kb 
最 大 值 : 917,504Kb 


GC 时 间 : PaNew (9.865 项 收集 ) 所 用 的 时 间 为 
ConcumentMarkSweep( 0 项 收集 ) 所 用 的 时 间 为 


2 inates 


0.000 秒 


图 10-13 内存 池 CMS Old Gen 使 用 情况 
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图 过 良久 帮助 2 
构 术 | 内 存 | 占 程 | 类 | m 摘要 | MBean| 司 
图 表 :| 直 堆 内 存 使 用 情况 同时 间 范 围 : 全 名 执行 多 
EE 
momt 
om 
mh 
Hm Wm dm Mom Wom Mo Wo on on do 
2009-05-21 
汪汪 
| 
Wd 
GC 时 间 : PaaNew (9.865 项 收集 ) 所 用 的 时 间 为 。 2 ninutes a 
| ConcunentMarkSweep( 0 项 收集 ) 所 用 的 时 间 为 0.000 炒 全 区 到 | 


10-14” 非 堆 内 存 使 用 情况 


A ss 
过 | 内存 Ed 
VM 搜 要 
2009 征 5 月 21 日 旺 才 四 上 午 08 时 3 分 07 秒 CST 
连 近 名 丈 : pid 2744org apeche eatylina sturtap Pootspmp sbart 正常 运行 时 间 : siows Jrminmes 
卡拉 机 :Jews HotsfotCTND Seer VM 让 11 3002 处 理 CPU 时 间 : 7 om aammswe 


JIT 编译 器 : HoGpa Tvd Coxplm 
编译 总 时 间 : 51727 东 


当前 境 大 小 tm, ss yo 分 本 的 内 存 : Lee 地 
堆 大 小 的 最 大 全 ;ce ent 芹 持 结束 撞 作 : 0 个 X 旬 
垃 执 收 集 器 ; Hans = Palow, Celbetione = D265, Total ti prat = Tninos 


增强 收集 器: Man = CoxcunmatMulSwesp; Colectoas =0, Tetal tome tpert =0.000 
秒 
操作 系统 : Widcws xP 51 加 理由 存 总 党 : xs cer ls; 光 
体 东 结 移 : :86 可 用 物理 内 存 : 4.229, 22 fob 
外 理 器 的 数目 : 2 交换 宣 间 总 量 : tlst 30 Kb 
分 配 的 虚拟 内 存 : 3,223 tr 地 可 用 交接 宣 间 :tst sn Kb 


VM 参 数 ; -Xel024M .Xml024M -Xiaual28M -NR Jew5ae-t26HMXX MahewSicer128NI-XX SuivodRuatio-20 -KX MusTemeing Thassheld-10 -XX GCTineFotir19 -XX HUstPaNewQC .XXX+UseConcMakSwsepOC -KX: 
CMSCHesUnicaiagiEnablsd 区 AUeeCMSCompaethtFalCaleeta XXXCNSFSUCC4BefbeCooqartiny=0 XX CMSPenlelRemubiind ed 区区 CMSLntiatngOecapuhcyFnncton=70 区 .SoftRofLRUPehoyMSPeaMB=0 YX: 


MaxpepnSas=256m-Dieaawtlpalhssrtme-Diva tingging rareger-ore pre jii Cs osecL nga -Djsve will ogire orthe iD TopreLOkcrfiogpag Prpertizs -Djsre cropesel dirs=D) 人 TcnoaiGeniomsod Dostalm 
booe DiTomest 6 Dodima howe-DiTomest 6 -Djeio tpdir DToeet btenp 


类 路径 : Cibo joe Dome 6tinbonbtnpja 

诛 路 径 :cjjilsac CDNDOWS SeebisC WINDO WSeyion 30 CNWINDOWSC SA oneb prea 0 2 DIENTIDOWS wy:IDOWS OTDDOWSG yen When C Frogaan FilbrComamor plaaTluadhr 
TsnttEanCniCoqytsC pro FeetTomise VO Pr PaNTRI CorptpyytyetTRTTC sof Sue Fon Fies Brom olee Prpan FisGmmiTC npamPilstDMConpter 
solute thn 


| 类 路 生 : Gijon je Set pepe meg jo edee jo edb denets jh 


图 10-15 30Vusers 运行 8 小 时 后 的 VM 摘要 截图 界面 


和 优化、 高 效 和 安全 的 量 优 方案 


10.2.7 ”测试 结果 分 析 


对 于 XX 局 采购 系统 的 登录 操作 来 说 ， 当 将 JVM 的 NewRatio 和 SurviorRatio 设置 成 
4 时 ， 性 能 表现 最 好 。 在 此 基础 上 在 设置 -XX:TargetSurvivorRatio=90 和 -Xmx1024M 后 性 能 
也 有 一 定 程度 的 提升 。 


10.3 性 能 问题 举例 


假设 某 高 校准 备 正式 上 线 并 运行 一 个 系统 ， 每 运行 一 段 时 间 后 程序 进程 会 莫名 其 妙 地 
被 kill 掉 ， 不 得 不 手工 启动 系统 。 本 节 将 以 此 背景 为 假设 ， 介 绍 解决 性 能 问题 的 方案 。 


10.3.1 查看 监控 结果 


(1) 使 用 jmap 命令 查看 堆 内 存 分 配 和 使 用 情况 : 


./jmap -heap 31 //31 为 程序 的 进程 号 

Attaching to process ID 31, please wait... 

Debugger attached successfully. 

Server compiler detected. 

JVM version is 11.0-bl2 // 显 示 jvm 的 版 本 号 

using parallel threads in the new generation. // 说 明 在 年 轻 代 使 用 了 并 行 收集 
using thread-local object allocation. 

Concurrent Mark-Sweep GC // 启 用 cMs 收集 模式 


Heap Configuration: 


MinHeapFreeRatio = 40 
MaxHeapFreeRatio = 70 // 这 两 项 说 明 堆 内 存 的 使 用 比例 在 308 一 608 之 间 
MaxHeapsize = 2147483648 (2048.0MB) // 最 大 堆 大 小 为 2048M 
NewSize = 805306368 (768.0MB) 
MaxNewSize = 805306368 (768.0MB) // 年 轻 代 大 小 为 768M 
Oldsize = 1342177280 (1280.0MB) // 老 年 代 代 大 小 为 1280M 
NewRatio =8 // 这 个 有 点 自 相 矛盾 ，1:8 
SurvivorRatio = 3 // 救 助 区 大 小 占 整 个 年 轻 代 的 五 分 之 一 
PermSize = 268435456 (256.0MB) // 持 久 代 大 小 为 256M 
MaxPermSize = 268435456 (256.0MB) // 持 久 代 大 小 为 256M 
Heap Usage: 


// 年 轻 代 大 小 ， 这 里 只 计算 了 一 个 救助 区 ， 所 以 少 了 153M 

New Generation (Eden + 1 Survivor Space) : 
capacity = 644284416 (614.4375MB) 
used = 362446760 (345.65616607666016MB) 
free = 281837656 (268.78133392333984MB) 
56.25570803810968% used 

//Eden Space 大 小 为 614.43-153=460.8M 

Eden Space: 
capacity = 483262464 (460.875MB) 
used = 342975440 (327.0868682861328MB) 
ree = 140287024 (133.7881317138672MB) 
70.97084204743864% used 
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/7 两 个 救助 区 的 大 小 均 为 153MB， 与 前 面 的 SurvivorRatio 参数 设置 值 计算 结果 一 致 


From Space: 
capacity = 161021952 (153.5625MB) 


used = 19471320 (18.569297790527344MB) 
free = 141550632 (134.99320220947266MB) 
12.092338813530219% used 
To Space: 
capacity = 161021952 (153.5625MB) 
used = 0 (0.0MB) 
free = 161021952 (153.5625MB) 
0.0% used 


// 老 年 代 大 小 为 1280M， 和 根据 参数 配置 计算 的 结果 一 致 。 
concurrent mark-sweep generation: 
capacity = 1342177280 (1280.0MB) 
used = 763110504 (727.7588882446289MB) 
free = 579066776 (552.2411117553711MB) 
56.85616314411163% used 
// 永 久 代 大 小 为 256M， 实 际 使 用 不 到 50%。 可 在 系统 运行 一 段 时 间 后 稳定 该 值 。 
Perm Generation: 
capacity = 268435456 (256.0MB) 
used = 118994736 (113.48222351074219MB) 
free = 149440720 (142.5177764892578MB) 
44.32899355888367% used 


(2) 使 用 Top 命令 监控 结果 ， 具 体 如 图 10-16 所 示 。 


# top 

last pid: 29658; load avg: 0.46, 0.36, 0.41; up 240+20:36:06 

53 processes: 50 sleeping, 1 zombie, 2 on cpu 

CPU states: 85.7% idle, 12.1* user, 2.2% kernel, 0.03 iowait, 0.0* swap 
Memory: 8191M phys mem, 3619M free mem, 8001M total swap, 8001M free swap 


PID USERNAME LWP PRI NICE SIZE RES STATE TINE CPU COMMAND 


29003 root 967 11 0 2601M 2411M cpu/0 487:09 13.26% java 

779 noaccess 28 59 0 183M 99M sleep 134:07 0.02% java 
29658 root 1 59 0 3044K 1736K cpu/l 0:00 0.02% top 

160 root 32 59 0 6324K 3012K sleep 20:32 0.0234 nscd 

690 root 1 59 0 25M 12M sleep 52:04 0.01% Xorg 

738 root 1 59 0 11M 7484K sleep 28:48 0.01% dtgreet 
29632 root 1 59 0 8192K 2060K sleep 0:00 0.00% sshd 

了 root 13 59 0 1 11M sleep 2:14 0.00% svc.startd 

856 root 1 59 0 7184K 1716K sleep 3:39 0.00% sendmail 

352 daemon 2 60 -20 3804K 3032K sleep 5:22 0.00% nfsacbd 

585 root 17 59 0 13M 8904K sleep 23:39 0.00% fmd 

384 root 4 59 0 4844K 3224K sleep 1:49 0.00% inetd 

393 root 1 59 0 1108K 640K sleep 0:15 0.00% utmpd 

353 daemon 13 59 0 697M 696M sleep 4:05 0.00% nfsmapid 
8485 root 8 59 0 6900K 5664K sleep 1:59 0.00% svc.configd 


图 10-16 Top 命令 监控 结果 


通过 使 用 top 命令 进行 持续 监控 发 现 此 时 CPU 空闲 比例 为 85.7%， 剩 余 物 理 内 存 为 
3619M， 虚 拟 内 存 8G 未 使 用 。 持 续 的 监控 结果 显示 进程 29003 占用 系统 内 存 不 断 在 增 
加 ， 已 经 快 得 到 最 大 值 。 

(3) 使 用 Jstat 命令 监控 结果 ， 有 具体 如 图 10-17 所 示 。 


» 图 


fi ava 


短 == 汪 权衡 优化 、 高 效 和 安全 的 最 优 方 案 


# /jstat -ygcutil 29003 1000 
$0 $1 E 0 
0.00 0.00 41.49 80.49 
0.00 0.00 41.51 80.49 
0.00 0.00 41.57 80.49 
0.00 0.00 41.57 80.49 
0.00 0.00 41.58 80.49 
0.00 0.00 41.59 80.49 
0.00 0.00 41.59 80.49 
0.00 0.00 41.61 80.49 
0.00 0.00 41.61 80.49 
0.00 0.00 41.62 80.49 
0.00 0.00 41.62 80.48 
0.00 0.00 41.69 80.48 
0.00 0.00 41.71 80.48 
0.00 0.00 41.73 80.48 
0.00 0.00 41.73 80.48 
0.00 0.00 41.81 80.48 
0.00 0.00 41.84 80.48 
0.00 0.00 41.91 80.48 


be 
己 
Ss 


YGC YGCT FGC FGCT GCT 
1635 35.472 21928 7327.744 7363.216 
1635 35.472 21929 7328.064 7363.536 
1635 35.472 21929 7328.064 ?7363. 536 
1635 35.472 21930 ?328.282 7363.754 
1635 35.472 21930 7328.282 7363.754 
1635 35.472 21930 7328.282 7363.754 
1635 35.472 21930 7328.282 7363.754 
1635 35.472 21930 7328.282 7363.754 
1635 35.472 21930 7328.282 7363.754 
1635 35.472 21931 7328.282 7363.754 
1635 35.472 21932 7328.818 7364.290 
1635 35.472 21932 7328.818 7364.290 
1635 35.472 21932 7328.818 7364.290 
1635 35.472 21932 7328.818 7364.290 
1635 35.472 21932 7328.818 7364.290 
1635 35.472 21932 7328.818 7364.290 
1635 35.472 21933 7329.139 7364.611 
1635 35.472 21933 7329.139 7364.611 


沪 当 安安 内 兴安 当 当当 当当 当当 安安 当 当 必 


GAAAAAAAAAIAIIAAAAS 


10-17 ”使 用 Jstat 命令 监控 结果 


使 用 jstat 命令 对 PID 为 29003 的 进程 进行 gc 回收 情况 检查 ， 发 现 由 于 Old 段 的 内 存 
使 用 量 已 经 超过 了 设 定 的 80% 的 警戒 线 ， 导 臻 系统 每 隔 一 两 秒 就 进行 一 次 FGC，FGC 的 
次 数 明显 多 余 YGC 的 次 数 ， 但 是 每 次 FGC 后 old 的 内 存 占 用 比例 却 没 有 明显 变化 一 系统 
尝试 进行 FGC 也 不 能 有 效 地 回收 这 部 分 对 象 所 占 内 存 。 同 时 也 说 明年 轻 代 的 参数 配置 可 
能 有 问题 ， 导 致 大 部 分 对 象 都 不 得 不 放 到 老年 代 来 进行 FGC 操作 ， 这 个 或 许 跟 系统 配置 
的 会 话 失效 时 间 过 长 有 关 。 

(4) 使 用 Jstack 打印 出 的 堆栈 内 容 ， 有 具体 如 


"EventMonitorThread[com.zzxy.willow.core. StandardContextDeployer@lbda9b9 - ZJGXSQ] ”daemon prio=3 tid=0x 
java. lang. Thread. State: WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
- waiting on <0xcc0340d8> (a com.zzxy.workflow.impl.monitor.EventQueue) 
at java.lang.Object.wait (Object. java: 485) 
at com,zzxy.workflow.impl.monitor.EventQueue. getNextEvent (EventQueue. java: 73) 
- locked <0xcc0340d8> (a com zzxy.workflow.impl.monitor.EventQueue) 
at com.ZZxy.workflow.impl.monitor.EventMonitorThread. run (EventMonitorThread, java: 45) 


图 10-18 所 示 。 


"EventMonitorThread[com. zzxy.willow.core. StandardCcontextDeployer8lbda9b9 - 评审 专家 信息 维护 审批 流程 ] ”da 
java.lang. Thread. State: WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
=- waiting on <0xcc0365d8> (a com.zzxy.workflow.impl.monitor.Eventoueue) 
at java.lang.object.wait (Object. java: 485) 
at com.zZzxy.workflow.impl.monitor.EventQueue.getNextEvent (EventQueue. java:73) 
~- locked <0xcc0365d8> (a com.zZzxy.workflow.impl.monitor.EventQueue) 
at com.ZzZxy.workflow.impl.monitor.EventMonitorThread. run (EventMonitorThread. java: 45) 


"EventMonitorThread[com.Zzzxy.willow.core. standardContextDeployer81lbda9b9 - 采购 计划 审批 ]" daemon prio=3 
java. lang. Thread. State: WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
- waiting on <0xcc036628> (a com.zzxy.workflow.impl.monitor.EventQueue) 
at java.lang.Object.wait (Object.java: 485) 
at com.Zzxy.workflow.impl.monitor.EventQueue.getNextEvent (EventQueue. java:73) 
- locked <0xcc036628> (a com.zzxy.workflow.impl.monitor.EventQueue) 


图 10-18 ”使 用 Jstack 打印 出 的 堆栈 内 容 


在 图 10-18 中 会 发 现 大 量 的 的 工作 流 线 程 锁 定 ， 在 图 10-19 中 也 会 发 现 大 量 的 CMS 线 
程 池 管 理 线程 锁定 。 
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"Thread-52390" daemon prio=3 tid=0x0bbdf400 nid=0xd60a in Object.wait () 
java.lang.Thread. state: TIMED WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
- waiting on <0xddd59d38> (a com.web.cms.infopub.publish.ThreadPool) 
at com. web. cms. infopub.publish.Threadpool.run(Threadpool.java:140) 
=- locked <0xddd59d38> (a com.web. cms.infopub.publish.Threadpool) 
at java.lang.Thread.run(Thread.java: 619 


"Thread-52261" daemon prio=3 tid=0x0a423000 nid=0xd582 in Object.wait () 
java.lang.Thread. state: TIMED WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
- waiting on <0xddb91780> (a com.web.cms.infopub.publish.ThreadPool) 


be locked <0xddb91780> (a com. Web- cms.infopub.publish.Threadpool) 
at java.lang.Thread. run(Thread. java: 619) 


"Thread-52257" daemon prio=3 tid=0x0adf2000 nid=0xd57e in Object.wait () 
java.lang.Thread. State: TIMED WAITING (on object monitor) 
at java.lang.Object.wait (Native Method) 
- waiting on <0xddb90200> (a com.web.cms.infopub.publish.ThreadPool 
at com.web.cms.infopub.publish.ThreadPool.run(ThreadPool.java:140) 
=- locked <0xddb90200> (a com.web.cms.infopub.publish.ThreadPool) 
at java.lang.Thread.run(Thread. java: 619) 


图 10-19 大 量 的 CMS 线程 池 管理 线程 锁定 


10.3.2 原因 分 析 


通过 对 JVM 内 存 进行 实时 监控 后 发 现 导致 老年 代 内 存 不 能 有 效 回收 的 原因 就 在 于 堆 
栈 中 存在 大 量 的 线程 死 锁 问题 。 建 议 开 发 组 认真 审查 源 代码 ， 看 看 是 否 存 在 线程 死 锁 的 
缺陷 。 

假设 该 系统 的 JVM 设置 如 下 : 


<jvm-options>-XX:+PrintGCApplicationConcurrentTime</jvm-options> <jvm- 
options>-XxX:+PrintGCApplicationstoppedTime</jvm-options> 
<jvm-options>-xXxX:+PrintGCTimeSstamps</jvm-options> 
<jvm-options>-xxX:+PrintGCDetails</jvm-options> 
<jvm-options>-xXxms2048m</jvm-options> 
<jvm-options>-xmx2048m</jvm-options> 
<jvm-options>-server</jvm-options> 
<jvm-options>-Djava.awt.headless=true</jvm-options> 
<jvm-options>-xXX:PermSize=256m</jvm-options> 
<jvm-options>-XX:MaxPermSize=256m</jvm-options> 
<jvm-options>-XX:+DisableExplicitGC</jvm-options> 
<jvm-options>-Xmn768M</jvm-options> 
<jvm-options>-XX:SurvivorRatio=3</jvm-options> 
<jvm-options>-Xss128K</jvm-options> 
<jvm-options>-xXxX:TargetSurvivorRatio=80</jvm-options> 
<jvm-options>-xXxX:MaxTenuringThreshold=5</jvm-options> 
<jvm-options>-XX:+UseConcMarkSweepGC</jvm-options> 
<jvm-options>-XxX:+CMSClassUnloadingEnabled</jvm-options> 
<jvm-options>-XxX:+UseCMSCompactAtFullCollection</jvm-options> 
<jvm-options>-XxX:-CMSParallelRemarkEnabled</jvm-options> 


由 此 可 见 ， 性 能 调 优 要 做 到 有 的 放 矢 ， 根 据 实际 业务 系统 的 特点 ， 以 一 定时 间 的 JVM 
志 记 录 为 依据 ， 进 行 有 针对 性 的 调整 、 比 较 和 观察 。 性 能 调 优 是 个 无 止境 的 过 程 ， 要 综 
ee ee de 
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开发 : 
、 高 效 和 安全 的 最 优 
仅仅 包括 JVM 的 调 优 ， 还 有 服务 器 硬件 配置 、 操 作 系统 参数 、 中 间 件 线程 池 、 数 据 库 连 
接 池 、 数 据 库 本 身 参 数 以 及 具体 的 数据 库 表 、 索 引 、 分 区 等 的 调整 和 优化 。 通 过 特定 工具 
检查 代码 中 存在 的 性 能 问题 ， 并 加 以 修正 是 一 种 比较 经 济 快捷 的 调 优 方法 。 


10.4 调 优 案例 分 析 


本 章 中 的 案例 大 部 分 来 源 于 笔者 处 理 过 的 一 些 问题 ， 还 有 一 小 部 分 来 源 于 网 上 有 特色 
和 代表 性 的 案例 总 结 。 出 于 对 客户 商业 信息 保护 的 目的 ， 在 不 影响 前 后 逻辑 的 前 提 下 ， 笔 
者 对 实际 环境 和 用 户 业 务 做 了 一 些 屏蔽 和 精简 。 


10.4.1 高 性 能 硬件 上 的 程序 部 署 策 略 


一 个 15 万 PV/ 天 左右 的 在 线 文档 类 型 网 站 最 近 更 换 了 硬件 系统 ， 新 的 硬件 为 4 个 
CPU、16GB 物理 内 存 ， 操 作 系统 为 64 位 CentOS 5.4，Resin 作为 Web 服务 器 。 整 个 服务 
器 暂时 没有 部 署 别 的 应 用 ， 所 有 硬件 资源 都 可 以 提供 给 访问 量 并 不 算 太 大 的 网 站 使 用 。 管 
理 员 为 了 尽量 利用 硬件 资源 选用 了 64 位 的 JDK 1.5， 并 通过 -Xmx 和 -Xms 参数 将 Java 堆 固 
定 在 12GB。 使 用 一 段 时 间 后 发 现 使 用 效果 并 不 理想 ， 网 站 经 常 不 定期 出 现 长 时 间 没有 响 
应 的 现象 。 

监控 服务 器 运行 状况 后 发 现 网 站 没有 响应 是 由 GC 停顿 导致 的 ， 虚 拟 机 运行 在 Server 
模式 ， 默 认 使 用 吞吐 量 优先 收集 器 ， 回 收 12GB 的 堆 ， 一 次 Full GC 的 停顿 时 间 高 达 14 
秒 。 并 且 由 于 程序 设计 的 关系 ， 访 问 文档 时 要 把 文档 从 磁盘 提取 到 内 存 中 ， 导 致 内 存 中 出 
现 很 多 由 文档 序列 化 产生 的 大 对 象 ， 这 些 大 对 象 很 多 都 进入 了 老年 代 ， 没 有 在 Minor GC 
中 清理 掉 。 这 种 情况 下 即使 有 12GB 的 堆 ， 内 存 也 很 快 会 被 消耗 列 尽 ， 由 此 导致 每 隔 十 几 
分 钟 出 现 十 几 秒 的 停顿 ， 令 网 站 开发 人 员 和 管理 员 感到 很 诅 丧 。 

这 里 先 不 延伸 讨论 程序 代码 问题 ， 程 序 部 署 上 的 主要 问题 显然 是 过 大 的 堆 内 存 进行 回 
收 时 带 来 的 长 时 间 的 停顿 。 硬 件 升 级 前 使 用 32 位 系统 1.5GB 的 堆 ， 用 户 只 感到 访问 网 站 
比较 缓慢 ， 但 不 会 发 生 十 分 明显 的 停顿 ， 因 此 才 考 虑 升级 硬件 提升 程序 效能 ， 如 果 重 新 缩 
小 给 Java 堆 分 配 的 内 存 ， 那 么 硬件 上 的 投资 就 浪费 了 。 

在 高 性 能 硬件 上 部 署 程 序 ， 目 前 主要 有 两 种 方式 : 

口 ” 通 过 64 位 JDK 来 使 用 大 内 存 。 

口 ” 使 用 若干 个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 

此 案例 中 的 管理 员 采 用 了 第 一 种 部 署 方式 。 对 于 用 户 交互 性 强 、 对 停顿 时 间 敏 感 的 系 
统 ， 可 以 给 Java 虚拟 机 分 配 超大 堆 的 前 提 是 有 把 握 把 应 用 程序 的 Full GC 频率 控制 得 足够 
低 ， 至 少 要 低 到 不 会 影响 用 户 使 用 ， 壁 如 十 几 个 小 时 乃至 一 天 才 出 现 一 次 Full GC， 这 样 
可 以 通过 在 深夜 执行 定时 任务 的 方式 触发 Full GC 甚至 自动 重启 应 用 服务 器 来 将 内 存 可 用 
空间 保持 在 一 个 稳定 的 水 平 。 

控制 Full GC 频率 的 关键 是 看 应 用 中 绝 大 多 数 对 象 能 否 符合 “ 朝 生 夕 灭 ”的 原则 ， 即 
大 多 数 对 象 的 生存 时 间 不 应 当 太 长 ， 尤 其 是 不 能 产生 成 批量 的 、 长 生存 时 间 的 大 对 象 ， 这 
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样 才能 保障 老年 代 空 间 的 稳定 。 
在 大 多 数 网 站 形式 的 应 用 里 ， 主 要 对 象 的 生存 周期 都 应 该 是 请 求 级 或 页 面 级 的 ， 会 话 
级 和 全 局 级 的 长 生命 对 象 相对 很 少 。 只 要 代码 写 得 合理 ， 应 当 都 能 实现 在 超大 堆 中 正常 使 
用 而 没有 Full GC， 这 样 的 话 ， 使 用 超大 堆 内 存 时 ， 网 站 响应 的 速度 才 比 较 有 保证 。 除 此 
之 外 ， 如 果 读 者 计划 使 用 64 位 JDK 来 管理 大 内 存 ， 还 需要 考虑 下 面 可 能 面临 的 问题 : 
口 ”内 存 回收 导致 的 长 时 间 停 顿 。 
口 ” 现 阶段 ，64 位 JDK 的 性 能 测试 结果 普遍 低 于 32 位 JDK。 
口 ”需要 保证 程序 足够 稳定 ， 因 为 这 种 应 用 要 是 产生 堆 溢 出 几乎 就 无 法 产生 堆 转 储 快 
照 (因为 要 产生 十 几 GB 乃至 更 大 的 dump 文件 )， 哪 怕 产 生 了 快照 也 几乎 无 法 进行 
分 析 。 
口 ”相同 的 程序 在 64 位 JDK 中 消耗 的 内 存 一 般 比 32 位 JDK 大 ， 这 是 由 指针 膨胀 及 
数据 类 型 对 齐 补 白 等 因素 导致 的 。 
上 面 的 问题 听 起 来 有 点 吓人 ， 所 以 现 阶段 不 少 管理 员 还 是 选择 第 二 种 方式 ; 使 用 若干 
个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 具 体 做 法 是 在 一 台 物 理 机 器 上 启动 多 个 应 
用 服务 器 进程 ， 给 每 个 服务 器 进程 分 配 不 同 的 端口 ， 然 后 在 前 端 搭建 一 个 负载 均衡 器 ， 以 
反 向 代理 的 方式 来 分 配 访 问 请 求 。 读 者 不 需要 太 在 意 均 衡器 转发 所 消耗 的 性 能 ， 即 使 使 
用 64 位 JDK， 许 多 应 用 也 不 止 有 一 台 服 务 器 ， 因 此 在 许多 应 用 中 前 端的 均衡 器 总 是 要 存 
在 的 。 
考虑 到 在 一 台 物 理 机 器 上 建立 逻辑 集群 的 目的 仅仅 是 尽 可 能 地 利用 硬件 资源 ， 并 不 需 
要 关心 状态 保留 、 热 转移 之 类 的 高 可 用 性 需求 ， 也 不 需要 保证 每 个 虚拟 机 进程 有 绝对 准确 
的 均衡 负载 ， 因 此 使 用 无 Session 复制 的 亲 合 式 集群 是 一 个 相当 不 错 的 选择 。 我 们 仅仅 需 
要 保障 集群 具备 亲 和 性 ， 也 就 是 均衡 器 按 一 定 的 规则 算法 (一 般 根 据 SessionID 分 配 ) 将 一 个 
固定 的 用 户 请 求 永远 分 配 到 固定 的 一 个 集群 节点 进行 处 理 即 可 ， 这 样 程 序 开 发 阶段 就 基本 
不 用 为 集群 环境 做 什么 特别 的 考虑 。 
当然 ， 很 少 有 没有 缺点 的 方案 ， 如 果 读 者 计划 使 用 逻辑 集群 的 方式 来 部 署 程序 ， 可 能 
会 遇 到 下 面 一 些 问 题 : 
口 ”尽量 避免 节点 竞争 全 局 的 资源 ， 最 典型 的 就 是 磁盘 竞争 ， 各 个 节点 如 果 同 时 访问 
某 个 磁盘 文件 的 话 (尤其 是 并 发 写 操作 容易 出 现 问题 )， 很 容易 导致 IO 异常。 
口 ”很 难 最 高 效率 地 利用 某 些 资源 地， 譬如 连接 池 ， 一 般 都 是 在 各 个 节点 建立 自己 独 
立 的 连接 池 ， 这 样 有 可 能 导致 一 些 节点 池 满 了 而 另外 一 些 节 点 仍 有 较 多 空余 。 
尽管 可 以 使 用 集中 式 的 JNDI， 但 这 有 一 定 的 复杂 性 并 且 可 能 带 来 额外 的 性 能 
代价 。 
口 “各 个 节点 仍然 不 可 避免 地 受到 32 位 的 内 存 限制 ， 在 32 位 Windows 平台 中 每 个 进 
程 只 能 使 用 2GB 的 内 存 ， 考 虑 到 堆 以 外 的 内 存 开 销 ， 堆 一 般 最 多 只 能 开 到 
1.5GB。 在 某 些 Linux、UNIX 系统 (如 Solaris) 中 ， 可 以 提升 到 3GB 乃至 接近 4GB 
的 内 存 ， 但 32 位 中 仍然 受 最 高 4GB (232) 内 存 的 限制 。 
大 量 使 用 本 地 缓存 (如 大 量 使 用 HashMap 作为 KN 缓存 ) 的 应 用 ， 在 逻辑 集群 中 会 造成 
较 大 的 内 存 浪费 ， 因 为 每 个 逻辑 节点 上 都 有 一 份 缓存 ， 这 时 可 以 考虑 把 本 地 缓存 改 为 集中 
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fi dapbui 


WS 入 = 权衡 优化 、 高 效 和 安全 的 最 优 方案 >， 


式 缓存 。 

介绍 完 这 两 种 部 署 方式 ， 再 重新 回 到 这 个 案例 之 中 ， 最 后 的 部 署 方 案 调整 为 建立 5 个 
32 位 JDK 的 逻辑 集群 ， 每 个 进程 按 2GB 内 存 计算 (其 中 堆 固定 为 1.5GB)， 占 用 了 10GB 的 
内 存 。 另 外 建立 一 个 Apache 服务 作为 前 端 均衡 代理 访问 门户 。 考 虑 到 用 户 对 响应 速度 比 
较 关 心 ， 并 且 文 档 服务 的 主要 压力 集中 在 磁盘 和 内 存 访问 上 ，CPU 资源 敏感 度 较 低 ， 因 此 
改 为 CMS 收集 器 进行 垃圾 回收 。 部 署 方式 调整 后 ， 服 务 再 没有 出 现 长 时 间 停 顿 ， 速 度 比 
硬件 升级 前 有 较 大 提升 。 


10.4.2 ” 堆 外 内 存 导致 的 涪 出 错误 


这 是 一 个 学 校 的 小 型 项 目 : 基于 B/S 的 电子 考试 系统 ， 为 了 实现 客户 端 能 实时 地 从 服 
务 端 接收 考试 数据 ， 系 统 使 用 了 逆向 AJAX 技术 (也 称 为 Comet 或 Server Side Push)， 选 用 
CometD 1.1.1 作为 服务 端 推 送 框架 ， 服 务 器 是 Jetty 7.1.4， 硬 件 为 一 台 普 通 PC(Core i5 
CPU，4GB 内 存 ， 运 行 32 位 Windows 操作 系统 )。 

测试 期 间 发 现 服 务 端 不 定时 抛 出 内 存 溢出 异常 ， 服 务 器 不 一 定 每 次 都 会 出 现 异常 ， 但 
假如 正式 考试 时 崩溃 一 次 ， 那 估计 整 场 电子 考试 都 会 乱 套 ， 网 站 管理 员 尝 试 过 把 堆 开 到 最 
大 ，32 位 系统 最 多 到 1.6GB 基本 无 法 再 加 大 了 ， 而 且 开 大 了 也 基本 没 效 果 ， 抛 出 内 存 溢 出 
异常 好 像 更 加 频繁 了 。 加 入 -XX:+HeapDumpOnOutOflVlemoryError， 居 然 也 没有 任何 反 
应 ， 抛 出 内 存 溢出 异常 时 什么 文件 都 没有 产生 。 无 奈 之 下 只 好 挂 着 jstat 使 劲 盯 屏幕 ， 发 现 
GC 并 不 频繁 ，Eden 区 、Survivor 区 、 老 年 代 及 永久 代 内 存 全 部 都 表示 “情绪 稳定 ， 压 力 
不 大 ”， 但 照样 不 停 地 抛 出 内 存 溢 出 异常 ， 管 理 员 压 力 很 大 。 最 后 ， 在 内 存 溢 出 后 从 系统 
日 志 中 找到 异常 堆栈 ， 代 码 清单 如 下 。 


Lorg.eclipse.Jjetty.util.1og] handle failed java.lang.OutOofMemoryError: null 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at java.nio.DirectByteBuffer. <init>( DirectByteBuffer.java:99) 
at java.nio.ByteBuffer.allocateDirect (ByteBuffer.java:288) 
at org.eclipse.jetty.io.nio.DirectNIOBuffer.<init> 
我 们 知道 操作 系统 对 每 个 进程 能 管理 的 内 存 是 有 限制 的 ， 这 台 服 务 器 使 用 的 32 位 
Windows 平台 的 限制 是 2GB， 其 中 给 了 Java 堆 1.6GB， 而 Direct Memory 并 不 算 在 1.6GB 
的 堆 之 内 ， 因 此 它 只 能 在 剩余 的 0.4GB 空间 中 分 出 一 部 分 。 在 此 应 用 中 导致 溢出 的 关键 
是 : 垃圾 收集 进行 时 ， 虚 拟 机 虽然 会 对 Direct Memory 进行 回收 ， 但 是 Direct Memory 却 不 
能 像 新 生 代 和 老年 代 那 样 ， 发 现 空间 不 足 了 就 通知 收集 器 进行 垃圾 回收 ， 它 只 能 等 待 老年 
代 满 了 后 Full GC， 然 后 “顺便 地 ” 帮 它 清理 掉 内 存 的 废弃 对 象 。 否 则 ， 它 只 能 等 到 抛 出 
内 存 溢出 异常 时 ， 先 catch 掉 ， 再 在 catch 块 里 面 “大 喊 ”一 声 : “System.gc(0!”。 要 是 虚 
拟 机 还 是 不 听 ( 璧 如 打开 了 -XX:+DisableExplicitGC 开关 )， 那 就 只 能 眼睁睁 地 看 着 堆 中 还 有 
许多 空闲 内 存 ， 自 己 却 不 得 不 抛 出 内 存 溢出 异常 了 。 而 本 案例 中 使 用 的 CometD 11.1 框 
架 ， 正 好 有 大 量 的 NIO 操作 需要 用 到 Direct Memory。 
从 实践 经 验 的 角度 出 发 ， 除 了 Java 堆 和 永久 代 之 外 ， 我 们 注意 到 下 面 这 些 区 域 还 会 占 
用 较 多 的 内 存 ， 这 里 所 有 的 内 存 总 和 会 受到 操作 系统 进程 最 大 内 存 的 限制 : 
口 Direct Memory: 可 通过 -XX:MaxDirectMemorySize 调整 大 小 ， 内 存 不 足 时 抛 出 
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OutOfMemoryError 或 OutOfMemoryError: Direct buffer memory。 

口 ”线程 堆栈 : 可 通过 -Xss 调整 大 小 ， 内 存 不 足 时 抛 出 StackOverflowError( 纵 向 无 法 
分 配 ， 即 无 法 分 配 新 的 栈 帧 ) 或 OutOfMemoryError: unable to create new native 
thread( 横 向 无 法 分 配 ， 即 无 法 建立 新 的 线程 )。 

口 ”Socket 缓存 区 : 每 个 Socket 连接 都 Receive 和 Send 两 个 缓存 区 ， 分 别 占 大 约 
37KB 和 25KB 的 内 存 ， 连 接 多 的 话 这 块 内 存 占用 也 比较 可 观 。 如 果 无 法 分 配 ， 
则 可 能 会 抛 出 IOException:Too many open files 异常 。 

口 _JNI 代码 : 如 果 代 码 中 使 用 JNI 调用 本 地 库 ， 那 本 地 库 使 用 的 内 存 也 不 在 堆 中 。 

口 ”虚拟 机 和 GC: 虚拟 机 和 GC 的 代码 执行 也 要 消耗 一 定 的 内 存 。 


10.4.3 外 部 命令 导致 系统 缓慢 


这 是 一 个 来 自 网 络 的 案例 : 一 个 数字 校园 应 用 系统 ， 运 行 在 一 台 4 个 CPU 的 Solaris 10 
操作 系统 上 ， 中 间 件 为 GlassFish 服务 器 。 系 统 在 进行 大 并 发 压力 测试 的 时 候 ， 发 现 请 求 
响应 时 间 比 较 慢 ， 通 过 操作 系统 的 mpstat 工具 发 现 CPU 使 用 率 很 高 ， 并 且 占 用 绝 大 多 数 
CPU 资源 的 程序 并 不 是 应 用 系统 本 身 。 这 是 个 不 正常 的 现象 ， 通 常情 况 下 用 户 应 用 的 CPU 
占用 率 应 该 占 主要 地 位 ， 才 能 说 明 系 统 是 正常 工作 的 。 

通过 Solaris 10 的 Dtrace 脚本 可 以 查看 当前 情况 下 哪些 系统 调用 花费 了 最 多 的 CPU 资 
源 ，Dtrace 运行 后 发 现 最 消耗 CPU 资源 的 竟然 是 “fork” 系 统 调 用 。 众 所 周知 ，fork 系统 
调用 是 Linux 用 来 产生 新 进程 的 ， 在 Java 虚拟 机 中 ， 用 户 编写 的 Java 代码 最 多 只 有 线程 
的 概念 ， 不 应 当 有 进程 的 产生 。 

这 是 个 非常 异常 的 现象 。 通 过 本 系统 的 开发 人 员 最 终 找到 了 答案 : 每 个 用 户 请 求 的 处 
理 都 需要 执行 一 个 外 部 shell 脚本 来 获得 系统 的 一 些 信息 。 执 行 这 个 shell 脚本 是 通过 Java 
的 Runtime.getRuntime().exec() 方 法 来 调用 的 。 这 种 调用 方式 可 以 达到 目的 ， 但 是 它 在 Java 
虚拟 机 中 非常 消耗 资源 ， 即 使 外 部 命令 本 身 能 很 快 执行 完毕 ， 频 繁 调用 时 创建 进程 的 开销 
也 非常 可 观 。Java 虚拟 机 执行 这 个 命令 的 过 程 是 : 首先 克隆 一 个 和 当前 虚拟 机 拥有 一 样 环 
境 变量 的 进程 ， 再 用 这 个 新 的 进程 去 执行 外 部 命令 ， 最 后 再 退出 这 个 进程 。 如 果 频 繁 执行 
这 个 操作 ， 系 统 的 消耗 会 很 大 ， 不 仅 是 CPU， 内 存 的 负担 也 很 重 。 

用 户 根据 建议 去 掉 这 个 shell 脚本 执行 的 语句 ， 改 为 使 用 Java 的 API 去 获取 这 些 信 息 
后 ， 系 统 很 快 就 恢复 了 正常 。 


10.4.4 ”服务 器 JVM 进程 崩溃 


一 个 基于 B/S 的 MIS 系统 ， 硬 件 为 两 台 2 个 CPU、8GB 内 存 的 HP 系统 ， 服 务 器 是 
WebLogic 9.2( 就 是 第 二 个 案例 中 的 那 套 系统 )。 正 常 运行 一 段 时 间 后 ， 最 近 发 现在 运行 期 间 
频繁 出 现 集群 节点 的 虚拟 机 进程 自动 关闭 的 现象 ， 留 下 了 一 个 hs_err_pid###.log 文件 后 ， 
进程 就 消失 了 ， 两 台 物 理 机 里 的 每 个 节点 都 出 现 过 进程 崩溃 的 现象 。 从 系统 日 志 中 注意 
到 ， 每 个 节点 的 虚拟 机 进程 在 崩溃 前 不 久 ， 都 发 生 过 大 量 相同 的 异常 。 
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代码 清单 10-1 异常 堆栈 


Jjava.net.SocketException: Connection reset 
fat j ava.net.SocketInputStream。Tread (SocketInputStream.java:168) 
}at j ava .io .Buf feredInputStream.fil1( BufferedInputStream.java:218) 
at]j ava .io. Buf feredInputStream.read (BufferedInputStream.java:235) 
七 

ee a .transport .http.HTTPSender.readHeadersFromSocket (HTTPSender .java:583) 
at org. apache.axis.transport.http.HTTPSender.invoke( HTTPSender.java:143) 
99 more 

这 是 一 个 远 端 断 开 连接 的 异常 ， 通 过 系统 管理 员 了 解 到 系统 最 近 与 一 个 OA 门户 做 了 
集成 ， 在 MIS 系统 工作 流 的 待 办 事项 变化 时 ， 要 通过 Web 服务 通知 OA 门户 系统 ， 把 待 
办 事项 的 变化 同步 到 OA 门户 之 中 。 通 过 SoapUI 测试 了 一 下 同步 待 办 事项 的 几 个 Web 服 
务 ， 发 现 调用 后 竟然 需要 长 达 3 分 钟 才能 返回 ， 并 且 返 回 的 结果 都 是 连接 中 断 。 

由 于 MIS 系统 的 用 户 多 ， 待 办 事项 变化 很 快 ， 为 了 不 被 OA 系统 的 速度 拖累 ， 使 用 了 
异步 的 方式 调用 Web 服务 ， 但 由 于 两 边 服务 的 速度 完全 不 对 等 ， 时 间 越 长 就 累积 了 越 多 
Web 服务 没有 调用 完成 ， 导 致 在 等 待 的 线程 和 Socket 连接 越 来 越 多 ， 最 终 超过 虚拟 机 的 承 
受 能 力 后 使 得 虚拟 机 进程 月 误 。 通 知 OA 门户 方 修复 无 法 使 用 的 集成 接口 ， 并 将 异步 调用 
改 为 生产 者 /消费 者 模式 的 消息 队列 实现 后 ， 系 统 恢复 正常 。 


10.5 “Eclipse 调 优 


很 多 Java 开发 人 员 都 有 这 样 一 种 观念 : 系统 调 优 的 工作 都 是 针对 服务 端 应 用 而 言 的 ， 
规模 越 大 的 系统 ， 需 要 越 专业 的 调 优 运 维 团 队 参 与 。 这 个 观点 不 能 说 不 对 ， 上 一 节 中 笔者 
所 列举 的 案例 确实 都 是 服务 端 运 维和 调 优 的 例子 ， 但 服务 端 应 用 需要 调 优 ， 并 不 说 明 其 他 
应 用 就 不 需要 了 ， 作 为 一 个 普通 的 Java 开发 人 员 ， 前 面 讲 的 各 种 虚拟 机 的 原理 和 最 佳 实践 
的 方法 距离 我 们 并 不 遥远 ， 开 发 者 身边 的 很 多 场景 都 可 以 使 用 上 面 这 些 知 识 。 下 面 就 通过 
一 个 普通 程序 员 日 常 工作 中 可 以 随时 接触 到 的 开发 工具 开始 这 次 实战 。 


10.5.1 Eclipse 快捷 键 


Ctrlt+ShifttL: 显示 Eclipse 的 快捷 键 。 

ctrltshiftto: 自动 引入 所 依赖 的 类 。 

Ctrl+1， 快速 修复 ， 这 是 最 经 典 的 快捷 键 。 

Ctrd+D: 删除 当前 行 。 

CtrltAltr 4 : 复制 当前 行 到 下 一 行 (复制 增加 )。 

Ctrl+Altr + : 复制 当前 行 到 上 一 行 (复制 增加 )。 

Altt 1 : 当前 行 和 下 面 一 行 交 互 位 置 (特别 实用 ， 可 以 省 去 先前 切 ， 再 粘贴 了 )。 
Altt + : 当前 行 和 上 面 一 行 交 互 位 置 (同上 )。 

Alt+ 一 : 前 一 个 编辑 的 页 面 。 

Alt+ 一 : 下 一 个 编辑 的 页 面 (当然 是 针对 上 面 那 条 来 说 了 )。 


口 
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让 折 在 .站 已 折 癌 右 站 在 问 站 右 口 口 


口 


口 


AltrEnter: 显示 当前 选择 的 资源 (例如 : 工程 或 文件 ) 的 属性 。 

Shift+Enter: 在 当前 行 的 下 一 行 插入 空 行 (这 时 鼠标 可 以 在 当前 行 的 任 一 位 置 ,不 一 
定 是 最 后 )。 

ShiftrCtrl+Enter: 在 当前 行 插入 空 行 (原理 同上 条 )。 

Ctrl+Q: 定位 到 最 后 编辑 的 地 方 。 

Ctrl+L: 定位 在 某 行 (对 于 程序 超过 100 的 人 就 有 福音 了 )。 

CtrlHM: 最 大 化 当前 的 Edit 或 View (再 按 则 反之 )。 

Ctrlt/: 注释 当前 行 ,再 按 则 取消 注释 。 

Ctrl+O: 快速 显示 OutLine。 

CtrltT : 快速 显示 当前 类 的 继承 结构 。 

CtrlHW: 关闭 当前 Editer。 

CtrlH+K: 参照 选中 的 Word 快速 定位 到 下 一 个 。 

Ctrl+E: 快速 显示 当前 Editer 的 下 拉 列 表 (如 果 当 前 页 面 没 有 显示 的 用 黑体 表示 )。 
CtrlH/( 小 键盘 ): 折 又 当前 类 中 的 所 有 代码 。 

Ctrl+X( 小 键盘 ): 展开 当前 类 中 的 所 有 代码 。 

Ctrl+Space: 代码 助手 完成 一 些 代 码 的 插入 (但 一 般 和 输入 法 有 冲突 ， 可 以 修改 输 
入 法 的 热 键 ,也 可 以 暂 用 Altt/ 来 代替 )。 

Ctrl+ShifttE: 显示 管理 当前 打开 的 所 有 的 View 的 管理 器 (可 以 选择 关闭 ， 激 活 等 
操作 )。 

Ctrl+J: 正 向 增 量 查找 ( 按 Ctrl+J 后 ,你 所 输入 的 每 个 字母 编辑 器 都 提供 快速 匹配 定 
位 到 某 个 单词 ， 如 果 没 有 ， 则 在 stutes line 中 显示 没有 找到 了 ， 查 一 个 单词 时 ， 
特别 实用 ， 这 个 功能 Idea 两 年 前 就 有 了 )。 

Ctrl+ShifttJ: 反 向 增 量 查找 (和 上 条 相同 ， 只 不 过 是 从 后 往 前 查 )。 

Ctrl+ShifttF4: 关闭 所 有 打开 的 Editer。 

Ctrlt+ShifttrX: 把 当前 选中 的 文本 全 部 变味 小 写 。 

CtrltShiftrY: 把 当前 选中 的 文本 全 部 变 为 小 写 。 

Ctrl+ShifttF: 格式 化 当前 代码 。 

Ctrl+ShifttP: 定位 到 对 于 的 匹配 符 ( 譬 如 分 ) (从 前 面 定 位 后 面 时 ， 光 标 要 在 匹配 符 
里 面 ， 后 面 到 前 面 ， 则 反之 )。 

Ctrl+Shift+fR: Open Resource， 通 过 输入 名 字 过 滤 来 打开 文件 。 


在 下 面 列 出 的 快捷 键 是 在 重 构 工 作 中 比较 常用 的 ( 注 : 一 般 重 构 的 快捷 键 都 是 Altt+Shift 
开头 的 )， 读 者 可 以 借鉴 以 提高 工作 效率 。 


口 


口 


Altt+ShifttrR: 重 命名 ， 对 变量 和 类 的 重 命名 来 说 ， 比 手工 方法 能 节省 很 多 劳 
动力 。 

AlttShifttM: 抽取 方法 (这 是 重 构 里 面 最 常用 的 方法 之 一 了 ， 尤 其 是 对 一 大 堆 泥 
团 代 码 有 用 )。 

Alt+ShifttC: 修改 函数 结构 (比较 实用 ， 有 N 个 函数 调用 了 这 个 方法 ， 修 改 一 次 
搞定 )。 

Alt+ShifttL: 抽取 本 地 变量 (可 以 直接 把 一 些 魔法 数字 和 字符 串 抽 取 成 一 个 变量 ， 


he 


尤其 是 多 处 调用 的 时 候 )。 

Alt+ShifttF: 把 Class 中 的 local 变量 变 为 field 变量 (比较 实用 的 功能 )。 
Alt+ShifttI: 合并 变量 (可 能 这 样 说 有 点 不 妥 Inline)。 

Alt+ShiftrV: 移动 函数 和 变量 (不 怎么 常用 )。 

AltrShift+Z: 重 构 的 后 悔 药 (Undo)。 


OOOO 


10.5.2 ”启动 运行 速度 调 优 


JVM 提供 了 各 种 用 于 调整 内 存 分 配 和 垃圾 回收 行为 的 标准 开关 和 非 标准 开关 。 其 中 
一 些 设置 可 以 提高 JAVA IDE 的 性 能 。 由 于 -X( 尤 其 是 -XX JVM) 开 关 通 常 是 JVM 或 
JVM 供应 商 特定 的 ， 本 部 分 介绍 的 开关 可 用 于 Sun Microsystems J2SE 1.4.2。 

以 下 设置 在 大 多 数 系统 上 将 产生 比 工 厂 更 好 的 设置 性 能 。 

口 “-vmargs: 表示 将 后 面 的 所 有 参数 直接 传递 到 所 指示 的 Java VM。 

口 ”-Xverify:none: 此 开关 关闭 Java 字 节 码 验证 ， 从 而 加 快 了 类 装 入 的 速度 ， 并 使 得 
在 仅 为 验证 目的 而 启动 的 过 程 中 无 须 装 入 类 。 此 开关 缩短 了 启动 时 间 ， 因 此 没有 
理由 不 使 用 它 。 

口 -Xms24m: 此 设置 指示 Java 虚拟 机 将 其 初始 堆 大 小 设置 为 24MB。 通 过 指示 JVM 
最 初 应 分 配给 堆 的 内 存 数量 ， 可 以 使 JVM 不 必 在 IDE 占用 较 多 内 存 时 增加 堆 
大 小 。 

口 -Xmx96m: 此 设置 指定 Java 虚拟 机 应 对 堆 使 用 的 最 大 内 存 数量 。 为 此 数量 设置 
上 限 表 示 Java 进程 消耗 的 内 存 数 量 不 得 超过 可 用 的 物理 内 存 数量 。 对 于 具有 更 多 
内 存 的 系统 可 以 增加 此 限制 ，96 MB 设置 有 助 于 确保 IDE 在 内 存量 为 128MB 
到 256MB 的 系统 上 能 够 可 靠 地 执行 操作 。 注 意 : 不 要 将 该 值 设置 为 接近 或 大 于 
系统 的 物理 内 存量 ， 否 则 将 在 主要 回收 过 程 中 导致 频繁 的 交换 操作 。 

口 ”-XX:PermSize=20m: 此 JVM 开关 不 仅 功 能 更 为 强大 ， 而 且 能 够 缩短 启动 时 间 。 
该 设置 用 于 调整 内 存 “ 永 久 区 域 ”( 类 保存 在 该 区 域 中 ) 的 大 小 。 因 此 我 们 向 JVM 
提示 它 将 需要 的 内 存量 。 该 设置 消除 了 许多 系统 启动 过 程 中 的 主要 垃圾 收集 事 
件 。SunONE Studio 或 其 他 包含 更 多 模块 的 IDE 的 用 户 可 能 希望 将 该 数值 设置 得 
更 高 。 

下 面 列 出 了 其 他 一 些 可 能 对 ECLIPSE 在 某 些 系统 (不 是 所 有 系统 ) 上 的 性 能 产生 轻微 

或 明显 影响 的 JVM 开关 。 尽 管 使 用 它们 会 产生 一 定 的 影响 ， 但 仍 值得 一 试 。 

口 “-XX:CompileThreshold=100: 此 开关 将 降低 启动 速度 ， 原 因 是 与 不 使 用 此 开关 相 
比 ，HotSpot 能 够 更 快 地 将 更 多 的 方法 编译 为 本 地 代码 。 其 结果 是 提高 了 IDE 
运行 时 的 性 能 ， 这 是 因为 更 多 的 UI 代码 将 被 编译 而 不 是 被 解释 。 该 值 表示 方法 
在 被 编译 前 必须 被 调用 的 次 数 。 

口 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC: 如 果 垃 圾 回收 频繁 中 断 ， 则 
请 尝试 使 用 这 些 开关 。 此 开关 导致 JVM 对 主要 垃圾 回收 事件 (如 果 在 多 处 理 器 工 
作 站 上 运行 ， 则 也 适用 于 次 要 回收 事件 ) 使 用 不 同 的 算法 ， 这 些 算法 不 会 影响 整个 
垃圾 回收 进程 。 注 意 : 目前 尚 不 确定 此 收集 器 是 提高 还 是 降低 单 处 理 器 计算 机 的 
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性 能 。 

口 ”-XX:+UseParallelGC: 某 些 测试 表明 ， 至 少 在 内 存 配置 相当 良好 的 单 处 理 器 系统 
中 ， 使 用 此 回收 算法 可 以 将 次 要 垃圾 回收 的 持续 时 间 减 半 。 注 意 ， 这 是 一 个 矛盾 
的 问题 ， 事 实 上 此 回收 器 主要 适用 于 具有 千 兆 字 节 堆 的 多 处 理 器 。 尚 无 可 用 数据 
表明 它 对 主要 垃圾 回收 的 影响 。 注 意 : 此 回收 器 与 -XX:+UseConcMarkSweepGC 
是 互 斥 的 。 

例如 512MB 内 存 的 启动 参数 是 : 


eclipse.exe -vmargs -Xverify:none -Xms64M -Xmx256M -XX:PermSize=20M 一 
XX:+UseParallelGC 


1G 内 存 的 启动 参数 是 : 


eclipse.exe -vmargs -Xverify:none -Xms128M -Xmx512M -XX:PermSize=64M — 
XX:MaxPermSize=128M -XX:+UseParallelGC 


10.5.3” 调 优 前 的 程序 运行 状态 


笔者 使 用 Eclipse 3.5 作为 日 常 工作 中 的 主要 IDE 工具 ， 由 于 安装 的 插件 比较 大 (如 
Klocwork、ClearCase LT 等 )、 代 码 也 很 多 ， 启 动 Eclipse 直到 所 有 项 目 编译 完成 需要 四 五 
分 钟 。 一 直 对 开发 环境 的 速度 感到 不 满意 ， 趁 着 编写 这 本 书 的 机 会 ， 决 定 对 Eclipse 进行 
“ 动 刀 ” 调 优 。 

笔者 机 器 的 Eclipse 运行 平台 是 32 位 Windows 7 系统 ， 虚 拟 机 为 HotSpot VM 1.5 
b64， 硬 件 为 ThinkPad X201、Intel I5 CPU、4GB 物理 内 存 。 在 初始 的 配置 文件 eclipse.mi 
中 ， 除 了 指定 JDK 的 路 径 ， 设 置 最 大 堆 为 512MB 及 开启 了 JMX 管理 (需要 在 VisualVM 
中 收集 原始 数据 ) 外 ， 未 作 任 何 改动 ， 原 始 配置 内 容 如 代码 清单 10-2 所 示 。 

代码 清单 10-2 Eclipse 3.5 初始 配置 


—vm 

D:/ DevSpace/j dk1.5. O/bin/j avaw. exe 

- startup 

- -launcher.librarye.equinox.launcher-1.o.201.R35X V20090715.jar 
— launCher.library 

plugins/org.eclipse. equinox .launcher. win32. win32 .x8 6 1.0.200.v20090519 
-product 

org. eclipse .epp .package.jee.product 

- -launcher.XXMaxPermSize 

256M 

-showsplash 

org.eclipse.platform 

—vmargs 

- Dosgi.requiredjavaVersion=1.5 

—Xmx512m 

- Dc am.sun.managemant.j mxr emote 


为 了 与 调 优 后 的 结果 进行 量化 对 比 ， 调 优 开始 前 笔者 先 做 了 一 次 初始 数据 测试 。 测 试 
用 例 很 简单 ， 就 是 收集 从 Eclipse 启动 开始 ， 直 到 所 有 插件 加 载 完 成 为 止 的 总 耗 时 及 运行 
状态 数据 ， 虚 拟 机 的 运行 数据 通过 VisualVM 及 其 扩展 插件 VisualGC 进行 采集 。 测 试 过 程 
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中 反复 启动 Eclipse 数 次 直到 测试 结果 稳定 后 ， 取 最 后 一 次 运行 的 结果 作为 数据 样本 (为 了 
避免 操作 系统 未 能 及 时 进行 磁盘 缓存 而 产生 的 影响 )。 

Eclipse 启动 的 总 耗 时 没有 办 法 从 监控 工具 中 直接 获得 ， 因 为 VisualVM 不 可 能 知道 
Eclipse 运行 到 什么 阶段 才 算是 启动 完成 。 为 了 保证 测试 的 准确 性 ， 笔 者 写 了 一 个 简单 的 
Eclipse 插件 ， 用 于 统计 Eclipse 的 启动 耗 时 。 由 于 代码 很 简单 ， 并 且 本 书 不 是 Eclispe RCP 
的 开发 教程 ， 所 以 只 列 出 代码 清单 10-3 供 读者 参考 ， 不 再 延伸 讲解 。 如 果 读 者 需要 这 个 插 
件 ， 可 以 使 用 下 面 的 代码 自己 编译 或 者 发 E-mail 给 笔者 索取 。 

代码 清单 10-3 Eclipse 启动 耗 时 统计 插件 


ShowTime .java 代码 : 

import org. eclipse.] face. dialogs.MessageDialog; 

import org.eclipse.swt.widgets.Display; 

import org. eclipse. swt.widgets. Shell; 

import org.eclipse.ui.IStartup; 

public class ShowTime implements IStartup{ 

public void earlyStartup() { 

Display.getDefault () .syncExec (new Runnable() 工 

public void run() { 

long eclipsestartTime=Long.parseLong (System.getProperty ("eclipse. 
startTime”))j 

long costTime=System.currentTimeMillis() —eclipsestartTime; 
Shell shell=Display.getDefault () .getActivesShell (); 

String message="Eclipse 启动 耗 时 : "+costTimet"ms"; 
MessageDialog.openInformation (shel1， "Information", message); 
) 

])， 

) 

) 


plugin. xml 代码 : 
<?xml version= "].0”encoding= "UTF-8”?> 
<?eclipse version=J'3.4"?> 
<plugin> 
<extension point=”org. eclipse.ui.startup”> 
<startup class="aclipsestarttime. actions. ShowTime"/> 
</extension> 
</plugin> 
上 述 代 码 打包 成 jar 后 放 到 Eclipse 的 plugins 目录 中 ， 反 复 启 动 几 次 后 ， 插 件 显 示 的 
平均 时 间 稳 定 在 15 秒 左右 。 根 据 VisualGC 和 Eclipse 插件 收集 到 的 信息 ， 总 结 原始 配置 
下 的 测试 结果 如 下 : 
口 ”整个 启动 过 程 平均 耗 时 约 15 秒 。 
口 ”最 后 一 次 启动 的 数据 样本 中 ， 垃 圾 收集 总 耗 时 4.149 秒 ， 其 中 Full GC 被 触发 了 
19 次 ， 共 耗 时 3.166 秒 。 而 Minor GC 被 触发 了 378 次 ， 共 耗 时 0.983 秒 。 
口 ” 加 载 类 9115 个 ， 耗 时 4.114 秒 。 
口 JIT 的 编译 时 间 为 1.999 秒 。 
口 虚拟 机 512MB 的 堆 内 存 被 分 配 为 40MB 的 新 生 代 (31.5MB 的 Eden 空间 和 2 个 
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4MB 的 Surviver 空间 ) 及 472MB 的 老年 代 。 

客观 地 说 ， 由 于 机 器 硬件 还 不 错 (请 读者 以 2010 年 普通 PC 的 标准 来 衡量 )，15 秒 的 启 
动 时 间 其 实 还 在 可 接受 的 范围 以 内 ， 但 是 从 VisualGC 中 反映 的 数据 来 看 ， 主 要 问题 是 非 
用 户 程 序 时 间 ( 图 10-2 中 的 Compile Time、Class Loader Time、GC Time) 非 常 高 ， 占 了 整个 
启动 过 程 耗 时 的 一 半 以 上 (这 里 存在 少许 夸张 成 分 ， 因 为 如 果 JIT 编译 等 动作 是 在 后 台 线 程 
完成 的 ， 用 户 程 序 在 此 期 间 也 正常 执行 ， 所 以 并 没有 占用 一 半 以 上 的 绝对 时 间 )。 虚 拟 机 后 
台 占 用 太 多 时 间 也 直接 导致 Eclipse 在 启动 后 的 使 用 过 程 中 经 常 有 停顿 的 感觉 ， 所 以 进行 
调 优 有 较 大 的 价值 。 


PT RO RR 六 


”虚拟 机 类 的 加 载 机 制 


前 面 讲解 了 Class 文件 存储 格式 的 具体 细节 ， 在 class 文件 中 描述 的 各 种 
信息 最 终 都 需要 加 载 到 虚拟 机 中 之 后 才能 被 运行 和 使 用 。 本 章 将 讲解 虚拟 机 如 
何 加 载 这 些 Class 文件 , 介绍 Class 文件 中 的 信息 进入 到 虚拟 机 后 会 发 生 什么 
变化 等 内 容 ， 为 读者 学 习 后 面 的 知识 打下 基础 。 
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虚拟 机 把 描述 类 的 数据 从 Class 文件 加 载 到 内 存 ， 并 对 数据 进行 校 验 、 转 换 解析 和 初 
始 化 ， 最 终 形成 可 以 被 虚拟 机 直接 使 用 的 Java 类 型 ， 这 就 是 虚拟 机 的 类 加 载 机 制 。 与 那些 
在 编译 时 需要 进行 连接 工作 的 语言 不 同 ， 在 Java 语言 里 面 ， 类 型 的 加 载 和 连接 过 程 都 是 在 
程序 运行 期 间 完成 的 ， 这 样 会 在 类 加 载 时 稍微 增加 一 些 性 能 开销 ， 但 是 却 能 为 Java 应 用 程 
序 提供 高 度 的 灵活 性 ，Java 中 天 生 可 以 动态 扩展 的 语言 特性 就 是 依赖 运行 期 动态 加 载 和 动 
态 连接 这 个 特点 实现 的 。 例 如 ， 如 果 编 写 一 个 使 用 接口 的 应 用 程序 ， 可 以 等 到 运行 时 再 指 
定 其 实际 的 实现 。 这 种 组 装 应 用 程序 的 方式 广泛 应 用 于 Java 程序 之 中 。 

为 了 避免 语言 表达 中 可 能 产生 的 偏差 ， 在 本 章 正式 开始 之 前 ， 笔 者 先 设立 如 下 两 个 语 
言 上 的 约定 。 

(1) 在 实际 情况 中 ， 每 个 Class 文件 都 有 可 能 代表 Java 语言 中 的 一 个 类 或 接口 ， 后 文 
中 直接 对 “类 ”的 描述 都 包括 了 类 和 接口 的 可 能 性 ， 而 对 于 类 和 接口 需要 分 开 描述 的 场景 
会 特别 指明 。 

(2) 笔者 所 说 的 “Class 文件 并 非 指 Class 必须 是 存在 于 具体 磁盘 中 的 某 个 文件 ， 这 里 
说 的 Class 文件 指 的 是 一 串 二 进 制 的 字 节 流 ， 无 论 以 何 种 形式 存在 都 可 以 。 

类 从 被 加 载 到 虚拟 机 内 存 中 开始 ， 到 务 载 出 内 存 为 止 ， 它 的 整个 生命 周期 包括 : 加 载 
(Loading) 、 验证 (Verification) 、 准 备 (Preparation) 、 解 析 (Resolution) 、 初 始 化 
(Initialization)、 使 用 (Using) 和 种 载 (Unloading)7 个 阶段 。 其 中 验证 、 准 备 和 解析 三 个 部 分 
统称 为 连接 (Linking)。 在 这 7 个 阶段 中 ， 加 载 、 验 证 、 准 备 、 初 始 化 和 卸载 这 5 个 阶段 的 
顺序 是 确定 的 ， 类 的 加 载 过 程 必须 按照 这 种 顺序 按部就班 地 开始 。 而 解析 阶段 则 不 一 定 ， 
它 在 某 些 情况 下 可 以 在 初始 化 阶段 之 后 再 开始 ， 这 是 为 了 支持 Java 语言 的 运行 时 绑 定 (也 
称 为 动态 绑 定 或 晚期 绑 定 )。 请 注意 这 里 写 的 是 按部就班 地 “开始 ”， 而 不 是 按部就班 地 
“进行 ”或 “完成 ”。 因 为 这 些 阶 段 通常 都 是 互相 交叉 地 混合 式 进行 的 ， 通 常会 在 一 个 阶 
段 执行 的 过 程 中 调用 或 激活 另外 一 个 阶段 。 

什么 情况 下 需要 开始 类 加 载 过 程 的 第 一 个 阶段 : 加载。 虚拟 机 规范 中 并 没有 进行 强制 
约束 ， 这 点 可 以 交 给 虚拟 机 的 具体 实现 来 自由 把 握 。 但 是 对 于 初始 化 阶段 ， 虚 拟 机 规范 则 
是 严格 规定 了 有 且 只 有 4 种 情况 必须 立即 对 类 进行 “初始 化 ”。 而 加 载 、 验 证 、 准 备 自然 
需要 在 此 之 前 开始 : 

(1) 遇 到 new、getstatic、putstatic 或 invokestatic 这 4 条 字 节 码 指令 时 ， 如 果 类 没有 进 
行 过 初始 化 ， 则 需要 先 触 发 其 初始 化 。 生 成 这 4 条 指令 的 最 常见 的 Java 代码 场景 是 ， 使 用 
new 关键 字 实 例 化 对 象 的 时 候 、 读 取 或 设置 一 个 类 的 静态 字段 (被 finaL 修饰 、 已 在 编译 期 
把 结果 放 入 常量 池 的 静态 字段 除外 ) 的 时 候 ， 以 及 调用 一 个 类 的 静态 方法 的 时 候 。 

(2) 使 用 java.langrefiect 包 的 方法 对 类 进行 反射 调用 的 时 候 ， 如 果 类 没有 进行 过 初始 
化 ， 则 需要 先 触发 其 初始 化 。 

(3) 当初 始 化 一 个 类 的 时 候 ， 如 果 发 现 其 父 类 还 没有 进行 过 初始 化 ， 则 需要 先 触发 其 


CE 


第 11 章 虚拟 机 类 的 加 载 机 制 蚤 


父 类 的 初始 化 。 

(4) 当 虚 拟 机 启动 时 ， 用 户 需 要 指定 一 个 要 执行 的 主 类 (包含 main() 方 法 的 那个 类 )， 虚 
拟 机 会 先 初始 化 这 个 主 类 。 

对 于 这 4 种 会 触发 类 进行 初始 化 的 场景 ， 虚 拟 机 规范 中 使 用 了 一 个 很 强烈 的 限定 语 ; 
“有 且 只 有 ”， 这 4 种 场景 中 的 行为 称 为 对 一 个 类 进行 主动 引用 。 除 此 之 外 所 有 引用 类 的 
方式 ， 都 不 会 触发 初始 化 ， 称 为 被 动 引 用 。 下 面 通过 三 段 代 码 分 别 来 说 明 被 动 引 用 的 

public class SuperClass { 


Staticf 
System.out .println("SuperClass init!"); 


} 


public static int value=123; 


} 
public class SubClass extends SuperClass{ 


statict{ 
System.out .println("SubClass init!"); 


} 


} 
public class NotInitialization { 


public static void main(String[] args){ 
System.out .println (SubClass.value); 


} 
} 


执行 上 述 代码 后 ， 会 输出 “SuperClass init!”， 而 不 是 输出 “SubClass initt”。 由 此 可 
见 ， 对 于 静态 字段 而 言 ， 只 有 直接 定义 这 个 字段 的 类 才 会 被 初始 化 ， 因 此 通过 其 子 类 来 引 
用 父 类 中 定义 的 静态 字段 ， 只 会 触发 父 类 的 初始 化 而 不 会 触发 子 类 的 初始 化 。 至 于 是 否 要 
触发 子 类 的 加 载 和 验证 ， 在 虚拟 机 规范 中 并 未 明确 规定 ， 这 点 取决 于 虚拟 机 的 具体 实现 。 
对 于 Sun HotSpot 虚拟 机 而 言 ， 可 通过 -XX:+TraceClassLoading 参数 看 到 此 操作 会 导致 子 类 
的 加 载 。 

第 二 段 代码 : 

public class NotInitialization { 

public static void main(String[] args){ 
// 这 里 的 字 节 码 指令 为 newarray 


SuperClass[] sca=new SuperClass[10]; 


} 
bP 


在 上 述 代码 中 ， 复 用 了 第 一 段 代码 中 的 SuperClass， 运 行 之 后 发 现 没有 输出 
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“SuperClass initl”， 这 说 明 并 没有 触发 类 org.zzz.class! oading.SuperClass 的 初始 化 阶段 。 
但 是 这 段 代 码 里 面 触发 了 另外 一 个 名 为 “Lorg.zzz.classloading.SuperClass” 的 类 的 初始 化 
阶段 。 对 于 用 户 代码 来 说 ， 这 并 不 是 一 个 合法 的 类 名 称 ， 它 是 一 个 由 虚拟 机 自动 生成 的 、 
直接 继承 于 java.lang.Obj ect 的 子 类 ， 创 建 动作 由 字 节 码 指令 newarray 触发 。 

这 个 类 代表 了 一 个 元 素 类 型 为 org.zzz.classloading.SuperClass 的 一 维 数组 ， 数 组 中 应 有 
的 属性 和 方法 (用 户 可 直接 使 用 的 只 有 被 修饰 为 public 的 length 属性 和 clone() 方 法 ) 都 实现 
在 这 个 类 里 。Java 语言 中 对 数组 的 访问 比 C/C++ 相对 安全 ， 因 为 这 个 类 包装 了 数组 元 素 的 
访问 方法 ， 而 C/C++ 直接 翻译 为 对 数组 指针 的 移动 。 在 Java 语言 中 ， 当 检查 到 发 生 数 组 越 
界 时 会 抛 出 java.lang.ArrayIndexOutofBoundsException 异常 。 
第 三 段 代 码 : 


public class ConstClass { 
public ConstClass() { 
System.out .println("ConstClass construction"); 


} 
public static final String HELLO WORLD = "hello world"; 


/太太 


人 本 质 上 没有 直接 引用 到 定义 常量 的 类 ， 因 此 不 会 触发 定义 常量 


public class NotInitialization { 


public static void main(String[] args) { 
System.out .println(ConstClass.HELLO WORLD) 
yi 后 台 打印 : 
Ki hello world 


运行 上 述 代码 之 后 ， 也 没有 输出 “ConstClass construction”， 这 是 因为 虽然 在 Java 源 
码 中 引用 了 ConstClass 类 中 的 常量 HELLOWORLD， 但 是 在 编译 阶段 将 此 常量 的 值 “hello 
world” 存 储 到 了 Notlnitialization 类 的 常量 池 中 ， 对 常量 ConstClassHELLOWORLD 的 引 
用 实际 都 被 转化 为 NotInitialization 类 对 自身 常量 池 的 引用 了 。 也 就 是 说 实际 上 
NotImitialization 的 Class 文件 之 中 并 没有 ConstClass 类 的 符号 引用 入 口 ， 这 两 个 类 在 编译 
成 Class 之 后 就 不 存在 任何 联系 了 。 

接口 的 加 载 过 程 与 类 加 载 过 程 稍 有 一 些 不 同 ， 针 对 接口 需要 做 一 些 特殊 说 明 : 接口 也 
有 初始 化 过 程 ， 这 点 与 类 是 一 致 的 ， 上 面 的 代码 都 是 用 静态 语句 块 “static{} ”来 输出 初始 
化 信息 的 ， 而 接口 中 不 能 使 用 “ static{} ”语句 块 ， 但 编译 器 仍然 会 为 接口 生成 

“<clinit>0” 类 构造 器 ， 用 于 初始 化 接口 中 所 定义 的 成 员 变量 。 接 口 与 类 真正 有 所 区 别 的 
是 前 面 讲述 的 四 种 “有 且 仅 有 ”需要 开始 初始 化 场景 中 的 第 三 种 : 当 一 个 类 在 初始 化 时 ， 
要 求 其 父 类 全 部 都 已 经 初始 化 过 了 ， 但 是 一 个 接口 在 初始 化 时 ， 并 不 要 求 其 父 接口 全 部 都 
完成 了 初始 化 ， 只 有 在 真正 使 用 到 父 接口 的 时 候 (如 引用 接口 中 定义 的 常量 ) 才 会 初始 化 。 
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11.2 ”类 的 加 载 过 程 


类 从 加 载 到 虚拟 机 到 御 载 ， 它 的 整个 生命 周期 包括 如 下 7 个 阶段 : 
口 “ 加 载 (Loading) 

口 ”验证 (Validation) 

口 ”准备 (Preparation) 

口 ”解析 (Resolution) 

口 ”初始 化 (Initialization) 

口 ”使 用 (Using) 

口 “ 印 载 (Unloading) 

其 中 ， 验 证 、 准 备 和 解析 部 分 被 称 为 连接 (Linking)， 如 图 11-1 所 示 。 


[本 一 
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11-1 类 的 加 载 过 程 


11.2.1 加载 


在 加 载 阶段 ， 虚 拟 机 主要 完成 三 件 事 : 

(1) 通过 一 个 类 的 全 限定 名 来 获取 定义 此 类 的 二 进 制 字 节 流 。 

(2) 将 这 个 字 节 流 所 代表 的 静态 存储 结构 转化 为 方法 区 域 的 运行 时 数据 结构 。 

(3) 在 Java 堆 中 生成 一 个 代表 这 个 类 的 java.lang.Class 对 象 ， 作 为 方法 区 域 数 据 的 访 
问 入 口 。 

虚拟 机 规范 的 这 三 点 要 求实 际 上 并 不 具体 ， 因 此 虚拟 机 实现 与 具体 应 用 的 灵活 度 相当 
大 。 例 如 “通过 一 个 类 的 全 限定 名 来 获取 定义 此 类 的 二 进 制 字 节 流 ”， 并 没有 指明 二 进 制 
字 节 流 要 从 一 个 Class 文件 中 获取 ， 准 确 地 说 是 根本 没有 指明 要 从 哪里 获取 及 怎样 获取 。 
虚拟 机 设计 团队 在 加 载 阶段 搭建 了 一 个 相当 开放 的 、 广 阔 的 舞台 ，Java 发 展 历程 中 ， 充 满 
创造 力 的 开发 人 员 们 则 在 这 个 舞台 上 玩 出 了 各 种 花样 ， 许 多 举足轻重 的 Java 技术 都 建立 在 
这 一 基础 之 上 ， 例 如 : 
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从 ZIP 包 中 读 取 ， 这 很 常见 ， 最 终 成 为 日 后 JAR、EAR、WAR 格式 的 基础 。 

从 网 络 中 获取 ， 这 种 场景 最 典型 的 应 用 就 是 Applet。 

运行 时 计算 生成 ， 这 种 场景 使 用 得 最 多 的 就 是 动态 代理 技术 ， 在 javalang. 
reflectProxy 中 ， 就 是 用 了 ProxyGenerator.generateProxyClass 来 为 特定 接口 生成 
*$Proxy 的 代理 类 的 二 进 制 字 节 流 。 

由 其 他 文件 生成 ， 典 型 场景 : JSP 应 用 。 

从 数据 库 中 读 取 ， 这 种 场景 相对 少见 些 ， 有 些 中 间 件 服务 器 (如 SAP Netweaver) 可 
以 选择 把 程序 安装 到 数据 库 中 来 完成 程序 代码 在 集群 间 的 分 发 。 

相对 于 类 加 载 过 程 的 其 他 阶段 ， 加 载 阶段 (准确 地 说 ， 是 加 载 阶段 中 获取 类 的 二 进 制 字 
节 流 的 动作 ) 是 开发 期 可 控 性 最 强 的 阶段 ， 因 为 加 载 阶段 既 可 以 使 用 系统 提供 的 类 加 载 器 来 
完成 ， 也 可 以 由 用 户 自 定义 的 类 加 载 器 去 完成 ， 开 发 人 员 可 以 通过 定义 自己 的 类 加 载 器 去 
控制 字 节 流 的 获取 方式 。 

加 载 阶段 完成 后 ， 虚 拟 机 外 部 的 二 进 制 字 节 流 就 按照 虚拟 机 所 需 的 格式 存储 在 方法 区 
之 中 ， 方 法 区 中 的 数据 存储 格式 由 虚拟 机 实现 自行 定义 ， 虚 拟 机 规范 未 规定 此 区 域 的 具体 
数据 结构 。 然 后 在 Java 堆 中 实例 化 一 个 java.lang.Class 类 的 对 象 ， 这 个 对 象 将 作为 程序 访 
问 方 法 区 中 的 这 些 类 型 数据 的 外 部 接口 。 加 载 阶段 与 连接 阶段 的 部 分 内 容 (如 一 部 分 字 节 码 
文件 格式 验证 动作 ) 是 交叉 进行 的 ， 加 载 阶段 尚未 完成 ， 连 接 阶段 可 能 已 经 开始 ， 但 这 些 夹 
在 加 载 阶段 之 中 进行 的 动作 ， 仍 然 属 于 连接 阶段 的 内 容 ， 这 两 个 阶段 的 开始 时 间 仍 然 保持 
着 固定 的 先后 顺序 。 


11.2.2 验证 


验证 阶段 作用 是 保证 Class 文件 的 字 节 流 包 含 的 信息 符合 JVM 规范 ， 不 会 给 JVM 造 
成 危害 。 如 果 验 证 失败 ， 就 会 抛 出 一 个 java.lang.VerifyError 异常 或 其 子 类 异常 。 验 证 是 连 
接 阶段 的 第 一 步 ， 这 一 阶段 的 目的 是 为 了 确保 Class 文件 的 字 节 流 中 包含 的 信息 符合 当前 
虚拟 机 的 要 求 ， 并 且 不 会 危害 虚拟 机 自身 的 安全 。 

Java 语言 本 身 是 相对 安全 的 语言 (依然 是 相对 于 C/C++ 来 说 )， 使 用 纯粹 的 Java 代码 无 
法 做 到 诸如 访问 数组 边界 以 外 的 数据 、 将 一 个 对 象 转型 为 它 并 未 实现 的 类 型 、 跳 转 到 不 存 
在 的 代码 行 之 类 的 事情 ， 如 果 这 样 做 了 ， 编 译 器 将 拒绝 编译 。 但 前 面 已 经 说 过 ，Class 文件 
并 不 一 定 要 求 用 Java 源码 编译 而 来 ， 可 以 使 用 任何 途径 ， 包 括 用 十 六 进 制 编辑 器 直接 编写 
来 产生 Class 文件 。 在 字 节 码 的 语言 层面 上 ， 上 述 Java 代码 无 法 做 到 的 事情 都 是 可 以 实现 
的 ， 至 少 语义 上 是 可 以 表达 出 来 的 。 虚 拟 机 如 果 不 检 查 输入 的 字 节 流 ， 对 其 完全 信任 的 
话 ， 很 可 能 会 因为 载 入 了 有 害 的 字 节 流 而 导致 系统 崩溃 ， 所 以 验证 是 虚拟 机 对 自身 保护 的 
一 项 重要 工作 。 尽 管 验证 阶段 是 非常 重要 的 ， 并 且 验 证 阶段 的 工作 量 在 虚拟 机 的 类 加 载 子 
系统 中 占 了 很 大 一 部 分 ， 但 虚拟 机 规范 对 这 个 阶段 的 限制 和 指导 显得 非常 笼统 ， 仅 仅 说 了 
一 句 如 果 验 证 到 输入 的 字 节 流 不 符合 Class 文件 的 存储 格式 ， 就 抛 出 一 个 
java.lang.VerifyError 异常 或 其 子 类 异常 ， 具 体 应 当 检查 哪些 方面 ， 如 何 检查 ， 何 时 检查 ， 
都 设 有 强制 要 求 或 明确 说 明 ， 所 以 不 同 的 虚拟 机 对 类 验证 的 实现 可 能 会 有 所 不 同 ， 但 大 致 
上 都 会 完成 下 面 四 个 阶段 的 检验 过 程 : 文件 格式 验证 、 元 数据 验证 、 字 节 码 验证 和 符号 引 
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用 验证 。 

(1) 文件 格式 验证 : 验证 字 节 流 文件 是 否 符合 Class 文件 格式 的 规范 ， 并 且 能 被 当前 虚 
拟 机 正确 的 处 理 。 

(2) 元 数据 验证 ， 是 对 字 节 码 描 述 的 信息 进行 语义 分 析 ， 以 保证 其 描述 的 信息 符合 
Java 语言 的 规范 。 

(3) 字 节 码 验 证 ， 主 要 是 进行 数据 流 和 控制 流 的 分 析 ， 保 证 被 校 验 类 的 方法 在 运行 时 
不 会 危害 虚拟 机 。 

(4) 符号 引用 验证 : 符号 引用 验证 发 生 在 虚拟 机 将 符号 引用 转化 为 直接 引用 的 时 候 ， 
这 个 转化 动作 将 在 解析 阶段 中 发 生 。 

在 接 下 来 的 内 容 中 ， 将 详细 讲解 上 述 4 个 验证 阶段 的 基本 知识 。 


1. 文件 格式 验证 


第 一 阶段 要 验证 字 节 流 是 否 符合 Class 文件 格式 的 规范 ， 并 且 能 被 当前 版 本 的 虚拟 机 
处 理 。 这 一 阶段 可 能 包括 下 面 这 些 验证 点 。 
是 否 以 魔 数 OxCAFEBABE 开头 。 
主 、 次 版 本 号 是 否 在 当前 虚拟 机 处 理 范围 之 内 。 
常量 池 的 常量 中 是 否 有 不 被 支持 的 常量 类 型 (检查 常量 tag 标志 )。 
指向 常量 的 各 种 索引 值 中 是 否 有 指向 不 存在 的 常量 或 不 符合 类 型 的 常量 。 
CONSTANT_Utf8_info 型 的 常量 中 是 否 有 不 符合 UTF8 编码 的 数据 。 

口 ”Class 文件 中 各 个 部 分 及 文件 本 身 是 否 有 被 删除 的 或 附加 的 其 他 信息 。 

实际 上 第 一 阶段 的 验证 点 还 远 不 止 这 些 ， 上 面 这 些 只 是 从 HotSpot 虚拟 机 源码 中 摘抄 
的 一 小 部 分 ， 该 验证 阶段 的 主要 目的 是 保证 输入 的 字 节 流 能 正确 地 解析 并 存储 于 方法 区 之 
内 ， 格 式 上 符合 描述 一 个 Java 类 型 信息 的 要 求 。 这 阶段 的 验证 是 基于 字 节 流 进行 的 ， 经 过 
了 这 个 阶段 的 验证 之 后 ， 字 节 流 才 会 进入 内 存 的 方法 区 中 进行 存储 ， 所 以 后 面 的 三 个 验证 
阶段 全 部 是 基于 方法 区 的 存储 结构 进行 的 。 

2. 元 数据 验证 

第 二 阶段 是 对 字 节 码 描述 的 信息 进行 语义 分 析 ， 以 保证 其 描述 的 信息 符合 Java 语言 规 
范 的 要 求 ， 这 个 阶段 可 能 包括 的 验证 点 如 下 : 

口 ” 这 个 类 是 否 有 父 类 (除了 java.lang.Object 之 外 ， 所 有 的 类 都 应 当 有 父 类 )。 

口 ” 这 个 类 的 父 类 是 否 继承 了 不 允许 被 继承 的 类 (被 final 修饰 的 类 )。 

口 ” 如 果 这 个 类 不 是 抽象 类 ， 是 否 实现 了 其 父 类 或 接口 之 中 要 求实 现 的 所 有 方法 。 

口 ”“ 类 中 的 字段 、 方 法 是 否 与 父 类 产生 了 了 矛盾 (例如 覆盖 了 父 类 的 final 字段 ， 或 者 出 

现 不 符合 规则 的 方法 重 载 ， 例 如 方法 参数 都 一 致 ， 但 返回 值 类 型 却 不 同等 )。 

第 二 阶段 的 主要 目的 是 对 类 的 元 数据 信息 进行 语义 校 验 ， 保 证 不 存在 不 符合 Java 语言 
规范 的 元 数据 信息 。 

3. 字 节 码 验 证 


第 三 阶段 是 整个 验证 过 程 中 最 复杂 的 一 个 阶段 ， 主 要 工作 是 进行 数据 流 和 控制 流 分 
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析 。 在 第 二 阶段 对 元 数据 信息 中 的 数据 类 型 做 完 校 验 后 ， 这 阶段 将 对 类 的 方法 体 进 行 校 验 
分 析 。 这 阶段 的 任务 是 保证 被 校 验 类 的 方法 在 运行 时 不 会 做 出 危害 虚拟 机 安全 的 行为 ， 
例如 : 

口 ” 保 证 任意 时 刻 操作 数 栈 的 数据 类 型 与 指令 代码 序列 都 能 配合 工作 ， 例 如 不 会 出 现 
类 似 这 样 的 情况 : 在 操作 栈 中 放置 了 一 个 int 类 型 的 数据 ， 使 用 时 却 按 long 类 型 
来 加 载 入 本 地 变量 表 中 。 
保证 跳 转 指令 不 会 跳 转 到 方法 体 以 外 的 字 节 码 指 令 上 。 
保证 方法 体 中 的 类 型 转换 是 有 效 的 ， 例 如 可 以 把 一 个 子 类 对 象 赋值 给 父 类 数据 类 
型 ， 这 是 安全 的 ， 但 是 把 父 类 对 象 赋值 给 子 类 数据 类 型 ， 甚 至 把 对 象 赋值 给 予 它 
毫 无 继承 关系 、 完 全 不 相干 的 一 个 数据 类 型 ， 则 是 危险 和 不 合法 的 。 

如 果 一 个 类 方法 体 的 字 节 码 没 有 通过 字 节 码 验 证 ， 那 肯定 是 有 问题 的 ， 但 如 果 一 个 方 
法 体 通 过 了 字 节 码 验 证 ， 也 不 能 说 明 其 一 定 就 是 安全 的 。 即 使 字 节 码 验 证 之 中 进行 了 大 量 
的 检查 ， 也 不 能 保证 这 一 点 。 这 里 涉及 了 离散 数学 中 一 个 很 著名 的 问题 “Halting 
Problem”: 通俗 一 点 的 说 法 就 是 ， 通 过 程序 去 校 验 程序 逻辑 是 无 法 做 到 绝对 准确 的 一 一 不 
能 通过 程序 准确 地 检查 出 程序 是 否 能 在 有 限 的 时 间 之 内 结束 运行 。 

由 于 数据 流 验证 的 高 复杂 性 ， 虚 拟 机 设计 团队 为 了 避免 将 过 多 的 时 间 消 耗 在 字 节 码 验 
证 阶段 ， 在 JDK 1.6 之 后 的 Javac 编译 器 中 进行 了 一 种 优化 ， 给 方法 体 的 Code 属性 的 属性 
表 中 增加 了 一 项 名 为 “StackMapTable” 的 属性 ， 这 项 属性 描述 了 方法 体 中 所 有 的 基本 块 
(Basic Block， 按 照 控 制 流 拆 分 的 代码 块 ) 开 始 时 本 地 变量 表 和 操作 栈 应 有 的 状态 ， 这 可 以 
将 字 节 码 验 证 的 类 型 推导 转变 为 类 型 检查 从 而 节省 一 些 时 间 。 当 然 ， 理 论 上 
StackMapTable 属性 也 存在 错误 或 被 算 改 的 可 能 ， 所 以 是 否 有 可 能 在 恶意 算 改 了 Code 属性 
的 同时 ， 也 生成 相应 的 StackMapTable 属性 来 骗 过 虚拟 机 的 类 型 校 验 则 是 虚拟 机 实现 时 值 
得 思考 的 问题 。 

在 JDK 1.6 以 后 的 版 本 的 HotSpot 虚拟 机 中 ， 提 供 了 -XX:-UseSplitVerifier 选项 来 关闭 
掉 这 项 优化 ， 或 者 使 用 参数 -XX:+FailOverToOldVerifier 要 求 在 类 型 校 验 失败 的 时 候 退 回 到 
旧 的 类 型 推导 方式 进行 校 验 。 而 在 JDK 1.7 之 后 ， 对 于 主 版 本 号 大 于 50 的 Class 文件 ， 使 
用 类 型 检查 来 完成 数据 流 分 析 校 验 则 是 唯一 的 选择 ， 不 允许 再 退回 到 类 型 推导 的 校 验 
为 式 ; 


4. 符号 引用 验证 


最 后 一 个 阶段 的 校 验 发 生 在 虚拟 机 将 符号 引用 转化 为 直接 引用 的 时 候 ， 这 个 转化 动作 
将 在 连接 的 第 三 个 阶段 一 一 解析 阶段 中 发 生 。 符 号 引用 验证 可 以 看 做 是 对 类 自身 以 外 (常量 
池 中 的 各 种 符号 引用 ) 的 信息 进行 匹配 性 的 校 验 ， 通 常 需要 校 验 以 下 内 容 : 

口 ”符号 引用 中 通过 字符 串 描 述 的 全 限定 名 是 否 能 找到 对 应 的 类 。 

口 ”在 指定 类 中 是 否 存在 符合 方法 的 字段 描述 符 及 简单 名 称 所 描述 的 方法 和 字段 。 

口 ”符号 引用 中 的 类 、 字 段 和 方法 的 访问 性 (private、protected、public、default) 是 否 

可 被 当前 类 访问 。 

符号 引用 验证 的 目的 是 确保 解析 动作 能 正常 执行 ， 如 果 无 法 通过 符号 引用 验证 ， 将 会 抛 

出 一 个 java.lang .IncompatibleClassChangeError 异常 的 子 类 ， 如 java.lang IllegalAccessError、 
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java.lang.NoSuchFieldError、java.lang.NoSuchMethodError 等 。 


验证 阶段 对 于 虚拟 机 的 类 加 载 机 制 来 说 ， 是 一 个 非常 重要 的 、 但 不 一 定 是 必要 的 阶 
段 。 如 果 所 运行 的 全 部 代码 (包括 自己 写 的 、 第 三 方 包 中 的 代码 ) 都 已 经 被 反复 使 用 和 验证 
过 ， 在 实施 阶段 就 可 以 考虑 使 用 -Xverify:none 参数 来 关闭 大 部 分 的 类 验证 措施 ， 以 缩短 虚 
拟 机 类 加 载 的 时 间 。 


11.2.3 准备 


准备 阶段 是 正式 为 类 变量 分 配 内 存 并 设置 类 变量 初始 值 的 阶段 ， 这 些 内存 都 将 在 方法 
区 中 进行 分 配 。 这 个 时 候 内 存 分 配 的 仅 包 括 类 变量 (static 变量 )， 不 包括 实例 变量 ， 实 例 变 
量 将 会 在 对 象 实例 化 时 随 着 对 象 一 起 分 配 在 java 堆 中 。 其 次 是 这 里 所 说 的 初始 值 “ 通 常情 
况 下 ”是 数据 类 型 的 零 值 (随后 在 初始 化 阶段 生成 定义 的 初 值 )。 如 果 该 变量 被 final 修饰 ， 
将 在 编译 时 生成 ConstantValue， 这 样 在 准备 阶段 将 直接 设置 成 该 初 值 。 

准备 阶段 是 正式 为 类 变量 分 配 内 存 并 设置 类 变量 初始 值 的 阶段 ， 这 些 内 存 都 将 在 方法 
区 中 进行 分 配 。 这 个 阶段 中 有 两 个 容易 产生 混淆 的 概念 需要 强调 一 下 ， 首 先是 这 时 候 进行 
内 存 分 配 的 仅 包 括 类 变量 (被 static 修饰 的 变量 )， 而 不 包括 实例 变量 ， 实 例 变量 将 会 在 对 象 
实例 化 时 随 着 对 象 一 起 分 配 在 Java 堆 中 。 其 次 是 这 里 所 说 的 初始 值 “ 通 常情 况 ” 下 是 数据 
类 型 的 零 值 ， 假 设 一 个 类 变量 的 定义 为 : 


public static int value=123; 


那么 变量 value 在 准备 阶段 过 后 的 初始 值 为 0 而 不 是 123， 因 为 这 时 候 尚未 开始 执行 任 
何 Java 方法 ， 而 把 value 赋值 为 123 的 putstatic 指令 是 程序 被 编译 后 ， 存 放 于 类 构造 器 
<clinit>() 方 法 之 中 ， 所 以 把 value 赋值 为 123 的 动作 将 在 初始 化 阶段 才 会 被 执行 。 在 “ 通 
常情 况 ” 下 初始 值 是 零 值 ， 那 相对 的 会 有 一 些 “ 特 殊 情 况 ”: 如 果 类 字段 的 字段 属性 表 中 
存在 ConstantValue 属性 ， 那 在 准备 阶段 变量 value 就 会 被 初始 化 为 ConstantValue 属性 所 
指定 的 值 ， 假 设 上 面 类 变量 value 的 定义 变 为 : 


public static final int value=123; 


编译 时 Javac 将 会 为 value 生成 ConstantValue 属性 ， 在 准备 阶段 虚拟 机 就 会 根据 
ConstantValue 的 设置 将 value 赋值 为 123 。 


11.2.4 解析 


解析 阶段 是 虚拟 机 将 常量 池内 的 符号 引用 蔡 换 为 直接 引用 的 过 程 ， 符 号 引用 在 本 书 前 
面 讲解 Class 文件 格式 的 时 候 就 已 经 出 现 过 多 次 ， 在 Class 文件 中 它 以 
CONSTANT Class info、CONSTANT Fieldref info、CONSTANT 一 Methodref info 等 类 型 
的 常量 出 现 ， 那 解析 阶段 中 所 说 的 直接 引用 与 符号 引用 又 有 什么 关联 呢 ? 

口 ”符号 引用 (Symbolic References): 符号 引用 以 一 组 符号 来 描述 所 引用 的 目标 ， 符 号 

可 以 是 任何 形式 的 字面 量 ， 只 要 使 用 时 能 无 歧义 地 定位 到 目标 即 可 。 符 号 引用 与 
虚拟 机 实现 的 内 存 布局 无 关 ， 引 用 的 目标 并 不 一 定 已 经 加 载 到 内 存 中 。 

口 ”直接 引用 (Direct References): 直接 引用 可 以 是 直接 指向 目标 的 指针 、 相 对 偏 移 量 
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或 是 一 个 能 间接 定位 到 目标 的 句柄 。 直 接 引 用 是 与 虚拟 机 实现 的 内 存 布局 相关 
的 ， 同 一 个 符号 引用 在 不 同 虚拟 机 实例 上 翻译 出 来 的 直接 引用 一 般 不 会 相同 。 如 
果 有 了 直接 引用 ， 那 引用 的 目标 必定 已 经 在 内 存 中 存在 。 
虚拟 机 规范 之 中 并 未 规定 解析 阶段 发 生 的 具体 时 间 ， 只 要 求 了 在 执行 anewarray、 
checkcast 、 getfield 、 getstatic 、 instanceof 、invokeinterface 、invokespecial 、invokestatic 、 
invokevirtual、multianewarray、new、putfield 和 putstatic 这 13 个 用 于 操作 符号 引用 的 字 节 
码 指令 之 前 ， 先 对 它们 所 使 用 的 符号 引用 进行 解析 。 所 以 虚拟 机 实现 会 根据 需要 来 判断 ， 
到 底 是 在 类 被 加 载 器 加 载 时 就 对 常量 池 中 的 符号 引用 进行 解析 ， 还 是 等 到 一 个 符号 引用 将 
要 被 使 用 前 才 去 解析 它 。 
对 同一 个 符号 引用 进行 多 次 解析 请 求 是 很 常见 的 事情 ， 虚 拟 机 实现 可 能 会 对 第 一 次 解 
析 的 结果 进行 缓存 (在 运行 时 常量 池 中 记录 直接 引用 ， 并 把 常量 标识 为 已 解析 状态 ) 从 而 避 
免 解析 动作 重复 进行 。 无 论 是 否 真正 执行 了 多 次 解析 动作 ， 虚 拟 机 需要 保证 的 都 是 在 同一 
个 实体 中 ， 如 果 一 个 符号 引用 之 前 已 经 被 成 功 解析 过 ， 那 么 后 续 的 引用 解析 请 求 就 应 当 一 
直 成 功 ， 同 样 地 ， 如 果 第 一 次 解析 失败 了 ， 其 他 指令 对 这 个 符号 的 解析 请 求 也 应 该 收 到 相 
同 的 异常 。 
解析 动作 主要 针对 类 或 接口 、 字 段 、 类 方法 、 接 口 方法 4 类 符号 引用 进行 ， 分 别 对 应 
于 常量 池 的 CONSTANT-Class_ info、CONSTANT- Fieldref info、CONSTANT_Methodref_ 
info 及 CONSTANT InterfaceMethodref info 四 种 常量 类 型 。 下 面 将 讲解 这 4 种 引用 的 解析 
过 程 。 
1. 类 或 接口 的 解析 


假设 当前 代码 所 处 的 类 为 D， 如 果 要 把 一 个 从 未 解析 过 的 符号 引用 N 解析 为 一 个 类 或 
接口 C 的 直接 引用 ， 那 虚拟 机 完成 整个 解析 的 过 程 需要 包括 以 下 三 个 步骤 。 

(1) 如 果 C 不 是 一 个 数组 类 型 ， 那 虚拟 机 将 会 把 代表 N 的 全 限定 名 传递 给 D 的 类 加 载 
器 去 加 载 这 个 类 C。 在 加 载 过 程 中 ， 由 于 元 数据 验证 、 字 节 码 验证 的 需要 ， 又 将 可 能 触发 
其 他 相关 类 的 加 载 动作 ， 例 如 加 载 这 个 类 的 父 类 或 实现 的 接口 。 一 旦 这 个 加 载 过 程 出 现 了 
任何 异常 ， 解 析 过 程 就 将 宣告 失败 。 

(2) 如 果 C 是 一 个 数组 类 型 ， 并 且 数 组 的 元 素 类 型 为 对 象 ， 也 就 是 N 的 描述 符 会 是 类 
似 “Ljava.lang.Integer” 的 形式 ， 那 将 会 按照 第 1 点 的 规则 加 载 数组 元 素 类 型 。 如 果 NN 的 
描述 符 如 前 面 所 假设 的 形式 ， 需 要 加 载 的 元 素 类 型 就 是 “java.lang.Integer”， 接 着 由 虚拟 
机 生成 一 个 代表 此 数组 维度 和 元 素 的 数组 对 象 。 

(3) 如 果 上 面 的 步骤 没有 出 现任 何 异 常 ， 那 么 C 在 虚拟 机 中 实际 上 已 经 成 为 一 个 有 效 
的 类 或 接口 了 ， 但 在 解析 完成 之 前 还 要 进行 符号 引用 验证 ， 确 认 C 是 否 具备 对 D 的 访问 权 
限 。 如 果 发 现 不 具备 访问 权限 ， 将 抛 出 java.lang.IllegalAccessError 异常 。 


2. 字段 解析 


要 解析 一 个 未 被 解析 过 的 字段 符号 引用 ， 首 先 将 会 对 字段 表 内 class_ index 项 中 索引 的 
CONSTANT Class info 符号 引用 进行 解析 ， 也 就 是 字段 所 属 的 类 或 接口 的 符号 引用 。 如 果 
在 解析 这 个 类 或 接口 符号 引用 的 过 程 中 出 现 了 任何 异常 ， 都 会 导致 字段 符号 引用 解析 的 失 
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败 。 如 果 解 析 成 功 完 成 ， 那 将 这 个 字段 所 属 的 类 或 接口 用 C 表示 ， 虚 拟 机 规范 要 求 按照 如 
下 步骤 对 C 进行 后 续 字 段 的 搜索 : 

(1) 如 果 C 本 身 就 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 
字段 的 直接 引用 ， 查 找 结束 。 

(2) 否则 ， 如 果 在 C 中 实现 了 接口 ， 将 会 按照 继承 关系 从 上 往 下 递归 搜索 各 个 接口 和 
它 的 父 接口 ， 如 果 接 口中 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 
个 字段 的 直接 引用 ， 查 找 结束 。 

(3) 否则 ， 如 果 C 不 是 java.lang.Object 的 话 ， 将 会 按照 继承 关系 从 上 往 下 递归 搜索 其 
父 类 ， 如 果 在 父 类 中 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 字 
段 的 直接 引用 ， 查 找 结束 。 

(4) 否则 ， 查 找 失 败 ， 抛 出 java.lang.NoSuchFieldError 异常 。 

如 果 查 找 过 程 成 功 返 回 了 引用 ， 将 会 对 这 个 字段 进行 权限 验证 ， 如 果 发 现 不 具备 对 字 
段 的 访问 权限 ， 将 抛 出 java.lang.lllegaIAccessError 异常 。 

在 实际 应 用 中 ， 虚 拟 机 的 编译 器 实现 可 能 会 比 上 述 规范 要 求 得 更 加 严格 一 些 ， 如 果 有 
一 个 同名 字段 同时 出 现在 C 的 接口 和 父 类 中 ， 或 者 同时 在 自己 或 父 类 的 多 个 接口 中 出 现 ， 
那 编译 器 将 可 能 拒绝 编译 。 例 如 在 下 面 的 演示 代码 中 ， 如 果 注 释 了 Sub 类 中 的 “public 
static int A=4:”， 接 口 与 父 类 同时 存在 字段 A， 那 编译 器 将 提示 “The field Sub.A is 
ambiguous”， 并 且 会 拒绝 编译 这 段 代 码 。 


package org.zzz.classloading ]j 

public class FieldResolution{ 

interface Interface0 { 

int A=0: 

} 

interface Interfacel extends Interface0 { 
int A=1; 

} 

interface Interface2 { 

int A=2; 

} 

static class Parent implements Interfacel { 
public static int A=3; 

} 

static class Sub extends Parent implements Interface2 { 
public static intA=4; 

} 

public static void main(String[] args) { 
System.out.println (Sub.A); 

} 

} 


3. 类 方法 解析 


类 方法 解析 的 第 一 个 步骤 与 字段 解析 一 样 ， 也 是 需要 先 解析 出 类 方法 表 的 class_ index 
项 中 索引 的 方法 所 属 的 类 或 接口 的 符号 引用 ， 如 果 解 析 成 功 ， 我 们 依然 用 C 表示 这 个 类 ， 
接 下 来 虚拟 机 将 会 按照 如 下 步骤 进行 后 续 的 类 方法 搜索 : 


本 六 


fi ava 


权衡 优化 、 高 效 和 安全 的 最 优 方案 


(1) 类 方法 和 接口 方法 符号 引用 的 常量 类 型 定义 是 分 开 的 ， 如 果 在 类 方法 表 中 发 现 
class index 中 索引 的 C 是 个 接口 ， 那 就 直接 抛 出 java.lang. IncompatibleClassChangeError 
异常 。 

(2) 如 果 通 过 了 第 (1) 步 ， 在 类 C 中 查找 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹 配 的 方 
法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 查 找 结束 。 

(3) 否则 ， 在 类 C 的 父 类 中 递归 查找 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹 配 的 方 
法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 查 找 结束 。 

(4) 否则 ， 在 类 C 实现 的 接口 列表 及 它们 的 父 接口 之 中 递归 查找 是 否 有 简单 名 称 和 描 
述 符 都 与 目标 相 匹 配 的 方法 ， 如 果 存在 匹配 的 方法 ， 说 明 类 C 是 一 个 抽象 类 ， 这 时 候 查 找 
结束 ， 抛 出 java.lang.AbstractMethodError 异常 。 

(5) 否则 宣告 方法 查找 失败 ， 抛 出 java.lang.NoSuchMethodError。 

最 后 ， 如 果 查 找 过 程 成 功 返 回 了 直接 引用 ， 将 会 对 这 个 方法 进行 权限 验证 : 如 果 发 现 
不 具备 对 此 方法 的 访问 权限 ， 将 抛 出 java.lang.IlegalAccessError 异常 。 


4. 接口 方法 解析 


接口 方法 也 是 需要 先 解 析出 接口 方法 表 的 class index 项 中 索引 的 方法 所 属 的 类 或 接口 
的 符号 引用 ， 如 果 解 析 成 功 ， 依 然 用 C 表示 这 个 接口 ， 接 下 来 虚拟 机 将 会 按照 如 下 步骤 进 
行 后 续 的 接口 方法 搜索 : 

(1) 与 类 方法 解析 相反 ， 如 果 在 接口 方法 表 中 发 现 class index 中 的 索引 C 是 个 类 而 不 
是 接口 ， 那 就 直接 抛 出 java.lang.IncompatibleClassChangeError 异常 。 

(2) 否则 ， 在 接口 C 中 查找 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹配 的 方法 ， 如 果 有 
则 返回 这 个 方法 的 直接 引用 ， 查 找 结 束 。 

(3) 否则 ， 在 接口 C 的 父 接口 中 递归 查找 ， 直 到 java.lang.Object 类 (查找 范围 会 包括 
Obj ect 类 ) 为 止 ， 看 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹 配 的 方法 ， 如 果 有 则 返回 这 个 
方法 的 直接 引用 ， 查 找 结束 。 

(4) 否则 ， 宣 告 方法 查找 失败 ， 抛 出 java.lang. NoSuchMethodError 异常 。 

由 于 接口 中 的 所 有 方法 都 默认 是 public 的 ， 所 以 不 存在 访问 权限 的 问题 ， 因 此 接口 方 
法 的 符号 解析 应 当 不 会 抛 出 java.lang.IllegalAccessError 异常 。 


11.2.5 ”初始 化 


类 初始 化 阶段 是 类 加 载 过 程 的 最 后 一 步 ， 前 面 的 类 加 载 过 程 中 ， 除 了 在 加 载 阶段 用 户 
应 用 程序 可 以 通过 自 定义 类 加 载 器 参与 之 外 ， 其 余 动作 完全 由 虚拟 机 主导 和 控制 。 到 了 初 
始 化 阶段 ， 才 真正 开始 执行 类 中 定义 的 Java 程序 代码 (或 者 说 是 字 节 码 )。 

在 初始 化 阶段 才 真正 开始 执行 类 中 定义 的 Java 程序 代码 。 在 准备 阶段 中 ， 变 量 已 经 赋 
过 一 次 系统 要 求 的 初始 值 ， 而 在 初始 化 阶段 ， 则 是 根据 程序 员 通 过 程序 制定 的 计划 来 赋 
值 。 或 者 说 ， 初 始 化 阶段 是 执行 类 构造 器 <clinit>0 方 法 的 过 程 。 

在 准备 阶段 ， 变 量 已 经 赋 过 一 次 系统 要 求 的 初始 值 ， 而 在 初始 化 阶段 ， 则 是 根据 程序 
员 通 过 程序 制定 的 主观 计划 去 初始 化 类 变量 和 其 他 资源 ， 或 者 可 以 从 另外 一 个 角度 来 表 
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达 : 初始 化 阶段 是 执行 类 构造 器 <clinit>() 方 法 的 过 程 。 我 们 放 到 后 面 再 讲 <clini>(0) 方 法 是 
怎么 生成 的 ， 在 这 里 ， 我 们 先 看 一 下 <clinit>() 方 法 执行 过 程 中 可 能 会 影响 程序 运行 行为 的 
一 些 特点 和 细节 ， 这 部 分 相对 更 贴近 于 普通 的 程序 开发 人 员 。 
口 ”<clinit>0 方 法 是 由 编译 器 自动 收集 类 中 的 所 有 类 变量 的 赋值 动作 和 静态 语句 块 
(static 人 } 块 ) 中 的 语句 合并 产生 的 ， 编 译 器 收集 的 顺序 是 由 语句 在 源 文件 中 出 现 的 
顺序 所 决定 的 ， 静 态 语句 块 中 只 能 访问 到 定义 在 静态 语句 块 之 前 的 变量 ， 定 义 在 
它 之 后 的 变量 ， 在 前 面 的 静态 语句 块 中 可 以 赋值 ， 但 是 不 能 访问 。 
口 ”<clinit>0 方 法 与 类 的 构造 函数 (或 者 说 实例 构造 器 <init>0 方 法 ) 不 同 ， 它 不 需要 显 
式 地 调用 父 类 构造 器 ， 虚 拟 机 会 保证 在 子 类 的 <clini>0 方 法 执行 之 前 ， 父 类 的 
<clinit>() 方 法 已 经 执行 完毕 。 因 此 在 虚拟 机 中 第 一 个 被 执行 的 <clinit>0 方 法 的 类 


肯定 是 java.lang.Object。 
口 ”由 于 父 类 的 <clinit>0 方 法 先 执 行 ， 也 就 意味 着 父 类 中 定义 的 静态 语句 块 要 优先 于 
子 类 的 变量 赋值 操作 。 


口 ”虚拟 机 会 保证 一 个 类 的 <clinit>0) 方 法 在 多 线程 环境 中 被 正确 地 加 锁 和 同步 ， 如 果 
多 个 线程 同时 去 初始 化 一 个 类 ， 那 么 只 会 有 一 个 线程 去 执行 这 个 类 的 <clinit>0 方 
法 ， 其 他 线程 都 需要 阻塞 等 待 ， 直 到 活动 线程 执行 <clinit>0 方 法 完毕 。 如 果 在 一 
个 类 的 <clinif>(0) 方 法 中 有 耗 时 很 长 的 操作 ， 那 就 可 能 造成 多 个 进程 阻塞 ， 在 实际 

应 用 中 这 种 阻塞 往往 是 很 隐蔽 的 ， 例 如 下 面 的 代码 演示 了 这 种 场景 。 


static class DeadLoopClass { 


static { 
11 4tp 果 不 加 上 这 个 if 语句 , 久 译 器 将 提示 "Initializer does not complete 
normally" . 
if (true) { 


System.out .println (Thread.currentThread() + "init DeadLoopClass"); 
while (true) { 
} 
} 
public static void main(String[J args) { 
Runnable script = new Runnable() { 
public void run() { 
. System.out.println (Thread.currentThread () + "start") ; 
DeadLoopClass dlc = new DeadLoopClass(); 
System.out .println (Thread.currentThread() + " run over"); 
}; 
Thread threadl = new Thread(script); 
Thread thread2 = new Thread(script); 
threadl .start ( ) : 
thread2 .start () ; 
} 


运行 结果 如 下 ， 一 条 线程 正在 死 循环 以 模拟 长 时 间 操 作 ; 另外 一 条 线程 在 阻塞 等 待 : 


Thread [Thread-0, 5,main] start 
Thread [Thread-1,5,main] start 
Thread[Thread-0, 5,main] init DeadLoopClass 


由 此 可 见 ，<clinit>0) 方 法 的 执行 顺序 是 按照 声明 的 顺序 排列 的 。 如 果 类 中 没有 声明 任 
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何 类 变量 和 静态 初始 化 语句 ， 那 么 就 不 会 生成 clinit 语句 。 如 果 类 中 仅 有 类 的 final 常量 或 
者 该 常量 的 初始 化 语句 是 由 编译 期 常量 组 成 的 语句 ， 那 么 也 不 会 生成 clinit 方法 ， 即 只 有 
存在 需要 执行 java 代码 的 赋值 才 会 生成 clinit。 接 下 来 通过 三 段 代码 来 说 明 <clinit>0 方 法 的 
执行 顺序 。 

第 一 段 : 


public class StaticParent { 


static int parent time = (int) (Math.random()); 
static final int PARENT FINAL = -17 


static { 
System.out.println (">>>StaticParent 初始 化 >>") ; 
上 


第 二 段 : 

public class Staticchild extends StaticParent{ 
// 不 需要 clinit 函数 初始 化 
static final int CHILD STATIC 1 = -1; 
// 需 要 clinit 初始 化 


static final int CHILD STATIC 2 


(int) (Math.random()*10); 


//blank final 
static int CHILD STATIC 3; 
// 缺 省 值 


static int CHILD STATIC 4 = 0; 
static Staticchild staticchild = new Staticchild(); 


public staticchild() { 
System.out .println (">>>Staticchild 构造 函数 >>>"); 
CHILD STATIC 3 = 3; 
CHILD STATIC 4 = 4; 

} 


static { 
System.out .println (">>>Staticchild 静态 初始 化 >>>"); 
CHILD STATIC 3 = 1; 
CHILD STATIC 4 = 2; 

} 


public static StaticChild getInstance(){ 
return staticChild; 
} 
} 


第 三 段 : 


public class StaticMain { 
public static void main(string []args){ 
StaticChild sc = Staticchild.getInstance(); 
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System.out .println("CHILD STATIC 1:"+sc.staticChild.CHILD STRATIC 1) 7 
System.out .println("CHILD STATIC 2:"+sc.staticChild.CHILD STRTIC 2); 
System.out .println("CHILD STATIC 3:"+sc.staticChild.CHILD STATIC 3); 
System.out .println("CHILD STATIC 4:"+sc.staticChild.CHILD STRATIC 4) 7 
} 
} 
执行 后 会 输出 : 


>>>StaticParent 初始 化 >> 
>>>Staticchild 构造 函数 >>> 
>>>Staticchild 静态 初始 化 >>> 
CHILD STATIC 1:-1 

CHILD STATIC 2:3 

CHILD STATIC 3:1 

CHILD STATIC 4:2 


通过 上 述 执行 结果 ， 可 以 看 出 <clinit>0 方 法 的 执行 顺序 。 
11.3 类 加 载 器 


类 加 载 器 是 沙 箱 的 第 一 道 防线 ， 因 为 代码 都 是 由 它 装 入 到 JVM 中 的 ， 在 其 中 也 有 可 
能 包括 危险 的 代码 。 类 加 载 器 的 安全 作用 有 如 下 三 点 : 

口 ”保护 善意 代码 不 受 恶意 代 码 的 干扰 。 

口 ”保护 已 验证 的 类 库 。 

口 ”代码 放 入 有 不 同 的 行为 限制 的 各 个 保护 域 中 。 

类 加 载体 系 通 过 使 用 不 同 的 类 加 载 器 把 类 放 入 不 同 的 名 字 空 间 中 从 而 保护 善意 代码 不 
受 恶意 代码 的 干扰 。JVM 为 每 个 类 加 载 器 维护 一 个 名 字 空 间 。 例 如 ， 如 果 JVM 在 某 个 名 
字 空 间 中 加 载 了 一 个 称 为 volcano 的 类 ， 就 不 能 再 在 这 个 名 字 空 间 中 加 载 另 一 个 也 称 为 
volcano 的 类 ， 除 非 你 再 创建 另 一 个 名 字 空 间 。 也 就 是 说 ， 如 果 JVM 有 三 个 名 字 空 间 ， 你 
就 可 以 加 载 三 个 叫做 volcano 的 类 ， 一 个 名 字 空 间 一 个 。 


11.3.1 类 加 载 器 的 基础 知识 


类 加 载 器 是 Java 语言 的 一 个 创新 ， 也 是 Java 语言 流行 的 重要 原因 之 一 。 它 使 得 
Java 类 可 以 被 动态 加 载 到 Java 虚拟 机 中 并 执行 。 类 加 载 器 从 JDK 1.0 就 开始 出 现 了 ， 最 
初 是 为 了 满足 Java Applet 的 需要 而 开发 出 来 的 。Java Applet 需要 从 远程 下 载 Java 类 文 
件 到 浏览 器 中 并 执行 。 现 在 类 加 载 器 在 Web 容器 和 “OSGi 中 得 到 了 广泛 的 使 用 。 一 般 来 
说 ，Java 应 用 的 开发 人 员 不 需要 直接 同类 加 载 器 进行 交互 。Java 虚拟 机 默认 的 行为 就 已 
经 足够 满足 大 多 数 情况 的 需求 了 。 不 过 如 果 遇 到 了 需要 与 类 加 载 器 进行 交互 的 情况 ， 而 对 
类 加 载 器 的 机 制 又 不 是 很 了 解 的 话 ， 就 很 容易 花 大 量 的 时 间 去 调试 
ClassNotFoundException 和 NoClassDefFoundError 等 异常 。 

类 加 载 器 (Class Loader) 用 来 加 载 Java 类 到 Java 虚拟 机 中 。 一 般 来 说 ，Java 虚拟 机 
使 用 Java 类 的 方式 : Java 源 程 序 (java 文件 ) 在 经 过 Java 编译 器 编译 之 后 就 被 转换 成 
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Java 字 节 代码 (.class 文件 )。 类 加 载 器 负责 读 取 Java 字 节 代码 ， 并 转换 成 java.lang.Class 
类 的 一 个 实例 。 每 个 这 样 的 实例 用 来 表示 一 个 Java 类 。 通 过 此 实例 的 newInstance() 方 法 
就 可 以 创建 出 该 类 的 一 个 对 象 。 实 际 的 情况 可 能 更 加 复杂 ， 比 如 Java 字 节 代码 可 能 是 通过 
工具 动态 生成 的 ， 也 可 能 是 通过 网 络 下载 的 。 

基本 上 所 有 的 类 加 载 器 都 是 javalang.ClassLoader 类 的 一 个 实例 。 下 面 详细 介绍 这 个 
Java 类 。 

1. java.lang.ClassLoader 类 介绍 

类 java.lang.ClassLoader 的 基本 职责 就 是 根据 一 个 指定 的 类 的 名 称 ， 找 到 或 者 生成 其 对 
应 的 字 节 代码 ， 然 后 从 这 些 字 节 代 码 中 定义 出 一 个 Java 类 ， 即 java.lang.Class 类 的 一 个 
实例 。 除 此 之 外 ，ClassLoader 还 负责 加 载 Java 应 用 所 需 的 资源 ， 如 图 像 文件 和 配置 文件 
等 。 不 过 本 文 只 讨论 其 加 载 类 的 功能 。 为 了 完成 加 载 类 的 这 个 职责 ，ClassLoader 提供 了 一 
系列 的 方法 ， 比 较 重要 的 方法 如 表 11-1 所 示 。 


表 11-1 ClassLoader 中 与 加 载 类 相关 的 方法 


方 法 说 明 
getParent() 返回 该 类 加 载 器 的 父 类 加 载 器 
loadClass(String name. 加 载 名 称 为 name 的 类 ， 返 回 的 结果 是 java.lang.Class 类 的 实例 
findClass(String name, 查找 名 称 为 name 的 类 ， 返 回 的 结果 是 java.lang.Class 类 的 实例 


查找 名 称 为 name 的 已 经 被 加 载 过 的 类 ， 返 回 的 结果 是 
java.lang.Class 类 的 实例 

defineClass(String name, byte[] b,，| 把 字 节 数组 b 中 的 内 容 转 换 成 Java 类 ， 返 回 的 结果 是 
int off. int len) java.lang.Class 类 的 实例 。 这 个 方法 被 声明 为 final 的 
TesolveClass(Class<?> c 链接 指定 的 Java 类 


对 于 表 11-1 中 给 出 的 方法 ， 表 示 类 名 称 的 name 参数 的 值 是 类 的 二 进 制 名 称 。 需 要 注 
意 的 是 内 部 类 的 表示 ， 如 com.example.Sample$1 和 com.example.Sample$Inner 等 表示 方 
式 。 这 些 方 法 会 在 下 面 介绍 类 加 载 器 的 工作 机 制 时 ， 做 进一步 的 说 明 。 下 面 介 绍 类 加 载 器 
的 树 状 组 织 结构 。 

2. 类 加 载 器 的 树 状 组 织 结构 


Java 中 的 类 加 载 器 大 致 可 以 分 成 两 类 ， 一 类 是 系统 提供 的 ， 另 外 一 类 则 是 由 Java 应 
用 开发 人 员 编 写 的。 系统 提供 的 类 加 载 器 主要 有 下 面 三 个 : 
口 “ 引 导 类 加 载 器 (Bootstrap Class Loader): 它 用 来 加 载 Java 的 核心 库 ， 是 用 原生 代 
码 来 实现 的 ， 并 不 继承 自 java.lang.ClassLoader。 
口 扩展 类 加 载 器 (Extensions Class Loader): 它 用 来 加 载 Java 的 扩展 库 。Java 虚拟 
机 的 实现 会 提供 一 个 扩展 库 目录 。 该 类 加 载 器 在 此 目录 里 面 查找 并 加 载 Java 类 。 
口 “系统 类 加 载 器 (System Class Loader): 它 根 据 Java 应 用 的 类 路 径 (CLASSPATH) 来 
加 载 Java 类 。 一般 来 说 ，Java 应 用 的 类 都 是 由 它 来 完成 加 载 的 。 可 以 通过 
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人 


第 11 章 虚拟 机 类 的 加 载 机 制 


ClassLoader.getSystemClassLoader() 来 获取 它 。 

除了 系统 提供 的 类 加 载 器 以 外 ， 开 发 人 员 可 以 通过 继承 java.lang.ClassLoader 类 的 方 
式 实现 自己 的 类 加 载 器 ， 以 满足 一 些 特殊 的 需求 。 

除了 引导 类 加 载 器 之 外 ， 所 有 的 类 加 载 器 都 有 一 个 父 类 加 载 器 。 通 过 表 11-1 中 给 出 的 
getParent() 方 法 可 以 得 到 。 对 于 系统 提供 的 类 加 载 器 来 说 ， 系 统 类 加 载 器 的 父 类 加 载 器 是 
扩展 类 加 载 器 ， 而 扩展 类 加 载 器 的 父 类 加 载 器 是 引导 类 加 载 器 ， 对 于 开发 人 员 编 写 的 类 加 
载 器 来 说 ， 其 父 类 加 载 器 是 加 载 此 类 加 载 器 Java 类 的 类 加 载 器 。 因 为 类 加 载 器 Java 类 
如 同 其 他 的 Java 类 一 样 ， 也 是 要 由 类 加 载 器 来 加 载 的。 一 般 来 说 ， 开 发 人 员 编写 的 类 加 
载 器 的 父 类 加 载 器 是 系统 类 加 载 器 。 类 加 载 器 通过 这 种 方式 组 织 起 来 ， 形 成 树 状 结构 。 树 
的 根 节点 就 是 引导 类 加 载 器 。 图 11-2 中 给 出 了 一 个 典型 的 类 加 载 器 树 状 组 织 结构 示意 图 ， 
其 中 的 箭头 指向 的 是 父 类 加 载 器 。 


开朗 人 扩编 员 统 

的 类 加 载 器 A Co 
开发 人 员 编 写 Ps 
的 类 加 载 器 8B1 关 加 载 器 


11-2 ”类 加 载 器 树 状 组 织 结构 示意 图 
例如 下 面 的 代码 演示 了 类 加 载 器 的 树 状 组 织 结构 。 


public class ClassLoaderTree { 
public static void main(String[] args) { 
ClassLoader loader = ClassLoaderTree.class.getClassLoader (); 
while (loader != null) { 
System.out .println (loader.tostring()); 
loader = loader.getParent (); 


} 
} 
} 


每 个 Java 类 都 维护 着 一 个 指向 定义 它 的 类 加 载 器 的 引用 ， 通 过 getClassLoader() 方 法 
就 可 以 获取 到 此 引用 。 代 码 清单 1 中 通过 递归 调用 getParent( 方 法 来 输出 全 部 的 父 类 加 载 
器 。 上 述 代码 的 运行 结果 如 下 所 示 。 


sun.misc.Launcher$AppClassLoader@9304bl 
sun.misc.Launcher$ExtClassLoader@190d11 


如 上 述 输出 结果 所 示 ， 第 一 个 输出 的 是 ClassLoaderTree 类 的 类 加 载 器 ， 即 系统 类 加 
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载 器 。 它 是 sun.misc.Launcher$SAppClassLoader 类 的 实例 ， 第 二 个 输出 的 是 扩展 类 加 载 
器 ， 是 sunmisc.Launcher$ExtClassLoader 类 的 实例 。 需 要 注意 的 是 这 里 并 没有 输出 引导 类 
加 载 器 ， 这 是 由 于 有 些 JDK 的 实现 对 于 父 类 加 载 器 是 引导 类 加 载 器 的 情况 ，getParent() 方 
法 返回 null。 

在 了 解 了 类 加 载 器 的 树 状 组 织 结构 之 后 ， 下 面 介绍 类 加 载 器 的 代理 模式 。 


3. 类 加 载 器 的 代理 模式 


类 加 载 器 在 尝试 自己 去 查找 某 个 类 的 字 节 代码 并 定义 它 时 ， 会 先 代理 给 其 父 类 加 载 
器 ， 由 父 类 加 载 器 先 去 尝试 加 载 这 个 类 ， 依 次 类 推 。 在 介绍 代理 模式 背后 的 动机 之 前 ， 首 
先 需 要 说 明 一 下 Java 虚拟 机 是 如 何 判定 两 个 Java 类 是 相同 的 。Java 虚拟 机 不 仅 要 看 类 的 
全 名 是 否 相 同 ， 还 要 看 加 载 此 类 的 类 加 载 器 是 否 一 样 。 只 有 两 者 都 相同 的 情况 ， 才 认为 两 
个 类 是 相同 的 。 即 便 是 同样 的 字 节 代码 ， 被 不 同 的 类 加 载 器 加 载 之 后 所 得 到 的 类 ， 也 是 不 
同 的 。 比 如 一 个 Java 类 com.example.Sample ， 编 译 之 后 生成 了 字 节 代码 文件 
Sample.class 。 两 个 不 同 的 类 加 载 器 ClassLoaderA 和 ClassLoaderB 分 别 读 取 了 这 个 
Sample.class 文件 ， 并 定义 出 两 个 java.lang.Class 类 的 实例 来 表示 这 个 类 。 这 两 个 实例 是 不 
相同 的 。 对 于 Java 虚拟 机 来 说 ， 它 们 是 不 同 的 类 。 试 图 对 这 两 个 类 的 对 象 进行 相互 赋 
值 ， 会 抛 出 运行 时 异常 ClassCastException。 下 面 通过 示例 来 具体 说 明 。 例 如 在 下 面 的 代 
码 中 ， 给 出 了 Java 类 com.example.Sample。 


package com.example; 
public class Sample { 
private Sample instance; 
public void setSample (Object instance) { 
this.instance = (Sample) instance; 
} 
} 


在 上 述 代码 中 ， 类 com.example.Sample 的 方法 setSample 接受 一 个 java.lang.Object 类 
型 的 参数 ， 并 且 会 把 该 参数 强制 转换 成 com.example.Sample 类 型 。 例 如 测试 Java 类 是 否 
相同 的 代码 如 下 。 


public void testCclassIdentity() { 
String classDataRootPath = "C:\\workspace\\Classloader\\classData"; 
FileSystemClassLoader fscll = new 
FileSystemClassLoader (classDataRootPath); 
FileSystemClassLoader fscl2 = new 
FileSystemClassLoader (classDataRootPath); 
String className = "com.example.Sample"; 
try { 
Class<?> classl = fscll.loadClass (className); 
Object objl = classl.newInstance(); 
Class<?> class2 = fsc]l2.loadClass (className); 
Object obj2 = class2.newInstance(); 
Method setSampleMethod = classl.getMethod("setSample", 
java.lang.Oobject.class); 
setsampleMethod.invoke (objl, obj2); 
} catch (Exception e) { 
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e-printStackTrace (); 
相 

} 

在 上 述 代 码 中 ， 使 用 了 类 FileSystemClassLoader 的 两 个 不 同 实例 来 分 别 加 载 类 
com.example.Sample, 得 到 了 两 个 不 同 的 Java.lang.Class 的 实例 ， 接 着 通过 newlInstance() 
方法 分 别 生 成 了 两 个 类 的 对 象 objl 和 obj2， 最 后 通过 Java 的 反射 API 在 对 象 objl 上 
调用 方法 setSample， 试 图 把 对 象 obj2 赋值 给 objl 内 部 的 instance 对 象 。 上 述 代 码 的 运 
行 结果 如 下 。 

java.lang.reflect.InvocationTargetException 

at sun.reflect.NativeMethodAccessorImp1.invoke0 (Native Method) 

3 .reflect .NativeMethodAccessorImpl .invoke (NativeMethodAccessorImpl .java:39) 

1 太 

3 .reflect .DelegatingMethodAccessorImpl .invoke (DelegatingMethodAccessorImpl 

i :25) 

a .lang.reflect.Method.invoke (Method.java:597) 

at classloader.ClassIdentity.testCclassIdentity (ClassIdentity.java:26) 

at classloader.ClassIdentity.main(ClassIdentity.java:9) 

Caused by: java.lang.ClassCastException: com.example.Sample 

cannot be cast to com.example.Sample 

at com.example.Sample.setSample (Sample.java:7) 

“0. more 

从 上 述 运行 结果 可 以 看 到 ， 运 行 时 抛 出 了 java.lang.ClassCastException 异常 。 虽 然 两 
个 对 象 objl 和 obj2 的 类 的 名 字 相 同 ， 但 是 这 两 个 类 是 由 不 同 的 类 加 载 器 实例 来 加 载 的 ， 
因此 不 被 Java 虚拟 机 认为 是 相同 的 。 

了 解 了 这 一 点 之 后 ， 就 可 以 理解 代理 模式 的 设计 动机 了 。 代 理 模 式 是 为 了 保证 Java 
核心 库 的 类 型 安全 。 所 有 Java 应 用 都 至 少 需要 引用 java.lang.Object 类 ， 也 就 是 说 在 运行 
的 时 候 ，java.lang.Object 这 个 类 需要 被 加 载 到 Java 虚拟 机 中 。 如 果 这 个 加 载 过 程 由 Java 
应 用 自己 的 类 加 载 器 来 完成 的 话 ， 很 可 能 就 存在 多 个 版 本 的 java.lang.Object 类 ， 而 且 这 些 
类 之 间 是 不 兼容 的 。 通 过 代理 模式 ， 对 于 Java 核心 库 的 类 的 加 载 工作 由 引导 类 加 载 器 
来 统一 完成 ， 保 证 了 Java 应 用 所 使 用 的 都 是 同一 个 版 本 的 Java 核心 库 的 类 ， 是 互相 兼 
容 的 。 

不 同 的 类 加 载 器 为 相同 名 称 的 类 创建 了 额外 的 名 称 空间 。 相 同名 称 的 类 可 以 并 存在 
Java 虚拟 机 中 ， 只 需要 用 不 同 的 类 加 载 器 来 加 载 它们 即 可 。 不 同类 加 载 器 加 载 的 类 之 间 是 
不 兼容 的 ， 这 就 相当 于 在 Java 虚拟 机 内 部 创建 了 一 个 个 相互 隔离 的 Java 类 空间 。 这 种 
技术 在 许多 框架 中 都 被 用 到 ， 后 面 会 详细 介绍 。 


4. 加 载 类 的 过 程 


在 前 面 介 绍 类 加 载 器 的 代理 模式 的 时 候 ， 提 到 过 类 加 载 器 会 首先 代理 给 其 他 类 加 载 器 
来 尝试 加 载 某 个 类 。 这 就 意味 着 真正 完成 类 的 加 载 工作 的 类 加 载 器 和 启动 这 个 加 载 过 程 的 
类 加 载 器 ， 有 可 能 不 是 同一 个 。 真 正 完 成 类 的 加 载 工作 是 通过 调用 defineClass 来 实现 的 ; 
而 启动 类 的 加 载 过 程 是 通过 调用 loadClass 来 实现 的 。 前 者 称 为 一 个 类 的 定义 加 载 器 
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(Defining Loader)， 后 者 称 为 初始 加 载 器 (Initiating Loader)。 在 Java 虚拟 机 判断 两 个 类 是 
否 相 同 的 时 候 ， 使 用 的 是 类 的 定义 加 载 器 。 也 就 是 说 ， 哪 个 类 加 载 器 启动 类 的 加 载 过 程 并 
不 重要 ， 重 要 的 是 最 终 定义 这 个 类 的 加 载 器 。 两 种 类 加 载 器 的 关联 之 处 在 于 : 一 个 类 的 定 
义 加 载 器 是 它 引 用 的 其 他 类 的 初始 加 载 器 。 如 类 com.example.Outer 引用 了 类 
com.example.Inner， 则 由 类 com.example.Outer 的 定义 加 载 器 负责 启动 类 com.example.Inner 
的 加 载 过 程 。 

方法 loadClass0 抛 出 的 是 java.lang.ClassNotFoundException 异常 ;方法 defineClass() 
抛 出 的 是 java.lang NoClassDefFoundError 异常 。 

类 加 载 器 在 成 功 加 载 某 个 类 之 后 ， 会 把 得 到 的 java.lang.Class 类 的 实例 缓存 起 来 。 下 
次 再 请 求 加载 该 类 的 时 候 ， 类 加 载 器 会 直接 使 用 缓存 的 类 的 实例 ， 而 不 会 尝试 再 次 加 载 。 
也 就 是 说 ， 对 于 一 个 类 加 载 器 实例 来 说 ， 相 同 全 名 的 类 只 加 载 一 次 ， 即 loadClass 方法 不 
会 被 重复 调用 。 

下 面 讨论 另外 一 种 类 加 载 器 : 线程 上 下 文 类 加 载 器 。 


5. 线程 上 下 文 类 加 载 器 


线程 上 下 文 类 加 载 器 (Context Class Loader) 是 从 JDK 1.2 开始 引入 的 。 类 java.lang.Thread 
中 的 方法 getContextClassLoader() 和 setContextClassLoader(ClassLoader cl) 用 来 获取 和 设置 
线程 的 上 下 文 类 加 载 器 。 如 果 没 有 通过 setContextClassLoader(ClassLoader cl) 方 法 进行 设置 
的 话 ， 线 程 将 继承 其 父 线程 的 上 下 文 类 加 载 器 。Java 应 用 运行 的 初始 线程 的 上 下 文 类 加 载 
器 是 系统 类 加 载 器 。 在 线程 中 运行 的 代码 可 以 通过 此 类 加 载 器 来 加 载 类 和 资源 。 

前 面 提 到 的 类 加 载 器 的 代理 模式 并 不 能 解决 Java 应 用 开发 中 会 遇 到 的 类 加 载 器 的 全 
部 问题 。Java 提供 了 很 多 服务 提供 者 接口 (Service Provider Interface，SPD， 人 允许 第 三 方 为 
这 些 接口 提供 实现 。 常 见 的 SPI 有 JDBC、JCE、JNDI、JAXP 和 JBI 等 。 这 些 SPI 的 
接口 由 Java 核心 库 来 提供 ， 如 JAXP 的 SPI 接口 定义 包含 在 javax.xml.parsers 包 中 。 这 
些 SPI 的 实现 代码 很 可 能 是 作为 Java 应 用 所 依赖 的 jar 包 被 包含 进来 ， 可 以 通过 类 路 径 
(CLASSPATH) 来 找到 ， 如 实现 了 JAXP SPI 的 Apache Xerces 所 包含 的 jar 包 。SPI 接口 
中 的 代码 经 常 需要 加 载 具体 的 实现 类 。 如 JAXP 中 的 javax.xml.parsers.Document 
BuilderFactory 类 中 的 newInstance() 方 法 用 来 生成 一 个 新 的 DocumentBuilderFactory 的 
实例 。 这 里 的 实例 的 真正 的 类 是 继承 自 javax.xml.parsers.DocumentBuilderFactory， 由 SPI 
的 实现 所 提供 的 。 如 在 Apache Xerces 中 ， 实 现 的 类 是 org.apache.xerces.jaxp. 
DocumentBuilderFactoryImpl。 而 问题 在 于 ，SPI 的 接口 是 Java 核心 库 的 一 部 分 ， 是 由 引 
导 类 加 载 器 来 加 载 的 ，SPI 实现 的 Java 类 一 般 是 由 系统 类 加 载 器 来 加 载 的 。 引 导 类 加 载 
器 是 无 法 找到 SPI 的 实现 类 的 ， 因 为 它 只 加 载 Java 的 核心 库 。 它 也 不 能 代理 给 系统 类 加 
载 器 ， 因 为 它 是 系统 类 加 载 器 的 祖先 类 加 载 器 。 也 就 是 说 ， 类 加 载 器 的 代理 模式 无 法 解决 
这 个 问题 。 

线程 上 下 文 类 加 载 器 正好 解决 了 这 个 问题 。 如 果 不 做 任何 的 设置 ，Java 应 用 的 线程 的 
上 下 文 类 加 载 器 默认 就 是 系统 上 下 文 类 加 载 器 。 在 SPI 接口 的 代码 中 使 用 线程 上 下 文 类 
加 载 器 ， 就 可 以 成 功 的 加 载 到 SPI 实现 的 类 。 线 程 上 下 文 类 加 载 器 在 很 多 SPI 的 实现 中 
都 会 用 到 。 
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下 面 介 绍 另外 一 种 加 载 类 的 方法 : Class.forName。 


6. Class.forName 


Class.forName 是 一 个 静态 方法 ， 同 样 可 以 用 来 加 载 类 。 该 方法 有 两 种 形式 : 
Class.forName(String name、 boolean initialize、ClassLoader loader) 和 Class.forName(String 
className)。 第 一 种 形式 的 参数 name 表示 的 是 类 的 全 名 ; initialize 表示 是 否 初始 化 类 ; 
loader 表示 加 载 时 使 用 的 类 加 载 器 。 第 二 种 形式 则 相当 于 设置 了 参数 initialize 的 值 为 
true，loader 的 值 为 当前 类 的 类 加 载 器 。Class.forName 的 一 个 很 常见 的 用 法 是 在 加 载 数 据 
库 驱 动 的 时 候 。 如 Class.forName("org.apache.derby.jdbc.EmbeddedDriver").newInstance() 用 
来 加 载 Apache Derby 数据 库 的 驱动 。 


11.3.2 ”JVM 启动 时 的 三 个 类 加 载 器 
当 JVM(Java 虚拟 机 ) 启 动 时 ， 会 形成 由 三 个 类 加 载 器 组 成 的 初始 类 加 载 器 层次 结构 : 


bootstrap classloader 
| 


extension classloader 


system classloader 
1. bootstrap classloader: 引导 (也 称 为 原始 ) 类 加 载 器 


负责 加 载 Java 的 核心 类 。 在 Sun 的 JVM 中 ， 在 执行 java 的 命令 中 使 用 
-Xbootclasspath 选项 或 使 用 - D 选项 指定 sun.boot.class.path 系统 属性 值 可 以 指定 附加 的 类 。 
这 个 加 载 器 的 是 非常 特殊 的 ， 它 实际 上 不 是 java.lang.ClassLoader 的 子 类 ， 而 是 由 JVM 自 
身 实现 的 。 大 家 可 以 通过 执行 以 下 代码 来 获得 bootstrap classloader 加 载 了 那些 核心 类 库 : 


URL[] urls=sun.misc.Launcher.getBootstrapClassPath () .getURLs (); 
for (int i = 0; i < urls.length; i++) { 

System.out.println (urls.toExternalForm()); 

} 


在 笔者 计算 机 上 的 结果 为 : 


file:/C: /I2adKk1. 01/jre/lib/endorsed/dom.jar 


心 
[ms 


file:/C:/j2sdk1.4.1 01/jre/lib/endorsed/sax.jar 
file:/C:/j2sdkl.4.1 01/jre/lib/endorsed/xalan-2.3.1.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/endorsed/xercesImpl-2.0.0.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/endorsed/xml-apis.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/endorsed/xsltc.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/rt.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/il8n.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/sunrsasign.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/jsse.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/jce.jar 
file:/C:/j2sdk1.4.1 01/jre/lib/charsets.jar 
file:/C:/j2sdk1.4.1 01/jre/classes 


这 时 大 家 知道 了 为 什么 我 们 不 需要 在 系统 属性 CLASSPATH 中 指定 这 些 类 库 了 吧 ， 
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为 VM 在 启动 的 时 候 就 自动 加 载 它们 了 。 
2. extension classloader: 扩展 类 加 载 器 


负责 加 载 JRE 的 扩展 目录 (JAVA _ HOME/jre/lib/ext 或 者 由 java.ext.dirs 系统 属性 指定 的 ) 
中 JAR 的 类 包 。 这 为 引入 除 Java 核心 类 以 外 的 新 功能 提供 了 一 个 标准 机 制 。 因 为 默认 的 
扩展 目录 对 所 有 从 同一 个 JRE 中 启动 的 JVM 都 是 通用 的 ， 所 以 放 入 这 个 目录 的 JAR 类 包 
对 所 有 的 JVM 和 system classloader 都 是 可 见 的。 在 这 个 实例 上 调用 方法 getParent0 总 是 返 
回 空 值 null， 因 为 引导 加 载 器 bootstrap classloader 不 是 一 个 真正 的 ClassLoader 实例 。 所 以 
当 大 家 执行 以 下 代码 时 : 

System.out .println (System.getProperty ("java.ext.dirs")); 

ClassLoader extensionClassloader=ClassLoader .getSystemClassLoader () .getParent (); 


System.out.println("the parent of extension classloader : 
"+extensionClassloader.getParent ()); 


结果 为 : 

C:/j2sdk1.4.1 01/jre/lib/ext 

the parent of extension classloader : null 

extension classloader 是 system classloader 的 parent， 而 bootstrap classloader 是 
extension classloader 的 parent， 但 它 不 是 一 个 实际 的 classloader， 所 以 为 null。 


3. system classloader: 系统 (也 称 为 应 用 ) 类 加 载 器 


负责 在 JVM 被 启动 时 ， 加 载 来 自在 命令 java 中 的 -classpath 或 者 java.class.path 系统 属 
性 或 者 CLASSPATH 操作 系统 属性 所 指定 的 JAR 类 包 和 类 路 径 。 总 能 通过 静态 方法 
ClassLoader.getSystemClassLoader() 找 到 该 类 加 载 器 。 如 果 没 有 特别 指定 ， 则 用 户 自 定义 的 
任何 类 加 载 器 都 将 该 类 加 载 器 作为 它 的 父 加 载 器 。 执 行 以 下 代码 即 可 获得 : 


System.out.println (System.getProperty ("java.class.path")); 


输出 结果 则 为 用 户 在 系统 属性 里 面 设置 的 CLASSPATH。 

classloader 加 载 类 用 的 是 全 盘 负责 委托 机 制 。 所 谓 全 盘 负责 ， 即 是 当 一 个 classloader 
加 载 一 个 Class 的 时 候 ， 这 个 Class 所 依赖 的 和 引用 的 所 有 Class 也 由 这 个 classloader 负责 
载 入 ， 除 非 是 显 式 的 使 用 另外 一 个 classloader 载 入 ; 委托 机 制 则 是 先 让 parent( 父 ) 类 加 载 器 
(而 不 是 super， 它 与 parent classloader 类 不 是 继承 关系 ) 寻 找 ， 只 有 在 parent 找 不 到 的 时 候 
才 从 自己 的 类 路 径 中 去 寻找 。 此 外 类 加 载 还 采用 了 cache 机 制 ， 也 就 是 如 果 cache 中 保存 
了 这 个 Class 就 直接 返回 它 ， 如 果 没有 才 从 文件 中 读 取 和 转换 成 Class， 并 存 入 cache， 这 
就 是 为 什么 我 们 修改 了 Class 但 是 必须 重新 启动 JVM 才能 生效 的 原因 。 

每 个 ClassLoader 加 载 Class 的 过 程 是 : 

(1) 检测 此 Class 是 否 载 入 过 ( 即 在 cache 中 是 否 有 此 Class)， 如 果 有 到 8， 如 果 没 有 
到 2。 

(2) 如 果 parent classloader 不 存在 (没有 parent， 那 parent 一 定 是 bootstrap classloader 
了 )， 到 4。 

(3) 请 求 parent classloader 载 入 ， 如 果 成 功 到 8， 不 成 功 到 5。 
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(4) 请 求 JVM 从 bootstrap classloader 中 载 入 ， 如 果 成 功 到 8。 

(5) 寻找 Class 文件 (从 与 此 classloader 相关 的 类 路 径 中 寻找 )， 如 果 找 不 到 则 到 7。 

(6) 从 文件 中 载 入 Class， 到 8。 

(7) 抛 出 ClassNotFoundException 异常 。 

(8) 返回 Class。 

其 中 (5)、(6) 步 我 们 可 以 通过 覆盖 ClassLoader 的 findClass 方法 来 实现 自己 的 载 入 策 
略 。 甚 至 覆盖 loadClass 方法 来 实现 自己 的 载 入 过 程 。 

类 加 载 器 的 顺序 是 : 先是 bootstrap classloader， 然 后 是 extension classloader， 最 后 才 
是 system classloader。 大 家 会 发 现 加 载 的 Class 越 是 重要 的 越 在 靠 前 面 。 这 样 做 的 原因 是 出 
于 安全 性 的 考虑 ， 试 想 如 果 system classloader“ 亲 自 ” 加 载 了 一 个 具有 破坏 性 的 

“javalang.System” 类 的 后 果 吧 。 这 种 委托 机 制 保证 了 用 户 即 使 具有 一 个 这 样 的 类 ， 也 把 

它 加 入 到 了 类 路 径 中 ， 但 是 它 永 远 不 会 被 载 入 ， 因 为 这 个 类 总 是 由 bootstrap classloader 来 
加 载 的 。 大 家 可 以 执行 一 下 以 下 的 代码 : 


System.out.println (System.class.getClassLoader ()); 


将 会 看 到 结果 是 null， 这 就 表明 java.lang.System 是 由 bootstrap classloader 加 载 的 ， 
为 bootstrap classloader 不 是 一 个 真正 的 ClassLoader 实例 ， 而 是 由 JVM 实现 的 ， 正 如 前 面 
已 经 说 过 的 。 

下 面 就 让 我 们 来 看 看 JVM 是 如 何 来 为 我 们 来 建立 类 加 载 器 的 结构 的 。 
sun.misc.Launcher， 顾 名 思 义 ， 当 你 执行 java 命令 的 时 候 ，JVM 会 先 使 用 bootstrap 
classloader 载 入 并 初始 化 一 个 Launcher， 执 行 下 面 的 代码 : 


System.out.println("the Launcher's classloader is 
"+sun.misc.Launcher.getLauncher () .getClass () .getClassLoader ()); 
结果 为 : 


the Launcher's classloader is null 


因为 是 用 bootstrap classloader 加 载 ， 所 以 class loader 为 null。 

Launcher 会 根据 系统 和 命令 设 定 初始 化 好 class loader 结构 ，JVM 就 用 它 来 获得 
extension classloader 和 system classloader, 并 载 入 所 有 的 需要 载 入 的 Class， 最 后 执行 java 命 
令 指定 的 带 有 静态 的 main 方法 的 Class 。extension classloader 实际 上 是 sunmisc. 
Launcher$ExtClassLoader 类 的 一 个 实例 ，system classloader 实际 上 是 sunmisc. 
Launcher$AppClassLoader 类 的 一 个 实例 ， 并 且 都 是 java.net.URLClassLoader 的 子 类 。 

让 我 们 来 看 看 Launcher 初始 化 过 程 的 部 分 代码 。 


public class Launcher { 

public Launcher() { 

ExtClassLoader extclassloader; 

try { 

// 初 始 化 extension classloader 

extclassloader = ExtClassLoader.getExtClassLoader (); 

} catch (IOException ioexception) { 

throw new InternalError ("Could not create extension class loader"); 


PD PNT OO EO p> 


i 


1 

try { 

// 初 始 化 system classloader, parent 是 extension classloader 

loader = AppClassLoader .getAppClassLoader (extclassloader); 

} catch (IOException ioexceptionl) { 

throw new InternalError("Could not create application class loader"); 


} 
// 将 system classloader 设置 成 当前 线程 的 context classloader (将 在 后 面 加 以 介绍 ) 
Thread.currentThread() .setContextClassLoader (loader); 


public ClassLoader getClassLoader() { 
// 返 回 system classloader 

return loader; 

} 

} 


extension classloader 的 部 分 代码 : 


static class Launcher$ExtClassLoader extends URLClassLoader { 
public static Launcher$ExtClassLoader getExtClassLoader () 
throws IOException 

{ 

File afile[] = getExtDirs(); 

return (Launcher$ExtClassLoader)AccessController.doPrivileged (new 
Launcher$] (afile)); 

} 

private static File[] getExtDirs() { 

// 获 得 系统 属性 “java.ext .dirs” 

String s = System.getProperty ("java.ext.dirs"); 

File afile[]; 

if(s != null) { 

StringTokenizer stringtokenizer = new StringTokenizer(s, File.pathSeparator); 
int i = stringtokenizer.countTokens (); 

afile = new File; 

For(int 3 = 0 I < 1 JE) 

afile[j] = new File(stringtokenizer.nextToken()); 

} else { 

afile = new File[0]; 

时 

return afile; 

1 

} 


system classloader 的 部 分 代码 : 


static class Launcher$AppClassLoader extends URLClassLoader 

{ 

public static ClassLoader getAppClassLoader (ClassLoader classloader) 
throws IOException 


{ 

// 获 得 系统 属性 “java.class.path” 

String s = System.getProperty ("java.class.path"); 

File afile[] = s != null ? Launcher.access$200(s) : new File[0]; 
return (Launcher$AppClassLoader)AccessController.doPrivileged (new 
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Launcher$2(s, afile, classloader)); 

人 

由 上 述 源 代码 可 知 ，extension classloader 是 使 用 系统 属性 “java.ext.dirs” 设 置 类 搜索 
路 径 的 ， 并 且 没 有 parent。system classloader 是 使 用 系统 属性 “java.class.path” 设 置 类 搜索 
路 径 的 ， 并 且 有 一 个 parent classloader。Launcher 初始 化 extension classloader、system 
classloader， 并 将 system classloader 设置 成 为 context classloader， 但 是 仅仅 返回 system 
classloader 给 JVM。 

这 里 怎么 又 出 来 一 个 context classloader 呢 ? 它 有 什么 用 呢 ? 我 们 在 建立 一 个 线程 
Thread 的 时 候 ， 可 以 为 这 个 线程 通过 setContextClassLoader 方法 来 指定 一 个 合适 的 
classloader 作为 这 个 线程 的 context classloader， 当 此 线程 运行 的 时 候 ， 我 们 可 以 通过 
getContextClassLoader 方法 来 获得 此 context classloader， 就 可 以 用 它 来 载 入 我 们 所 需要 的 
Class。 默 认 的 是 system classloader。 利 用 这 个 特性 ， 我 们 可 以 “打破 ”classloader 委托 机 
制 了 ， 父 classloader 可 以 获得 当前 线程 的 context classloader， 而 这 个 context classloader 可 
以 是 它 的 子 classloader 或 者 其 他 的 classloader， 那 么 父 classloader 就 可 以 从 其 获得 所 需 的 
Class， 这 就 打破 了 只 能 向 父 classloader 请 求 的 限制 了 。 这 个 机 制 可 以 满足 当 我 们 的 
classpath 是 在 运行 时 才 确 定 ， 并 由 定制 的 classloader 加 载 的 时 候 ， 由 system classloader( 即 
在 jvm classpath 中 ) 加 载 的 class 可 以 通过 context classloader 获得 定制 的 classloader 并 加 载 
入 特定 的 class( 通 常 是 抽象 类 和 接口 ， 定 制 的 classloader 中 是 其 实现 )， 例 如 Web 应 用 中 的 
Servlet 就 是 用 这 种 机 制 加 载 的 。 

现在 我 们 了 解 了 classloader 的 结构 和 工作 原理 ， 那 么 是 如 何 实现 在 运行 时 的 动态 载 入 
和 更 新 呢 ? 只 要 能 够 动态 改变 类 搜索 路 径 和 清除 classloader 的 cache 中 已 经 载 入 的 Class 即 
可 ， 具 体 有 如 下 两 个 方案 可 以 实现 。 

(1) 继承 一 个 classloader， 覆 盖 loadclass 方法 ,动态 的 寻找 Class 文件 并 使 用 
defineClass 方法 来 。 

(2) 只 要 重新 使 用 一 个 新 的 类 搜索 路 径 来 new 一 个 classloader 就 行 了 ， 这 样 即 更 新 了 
类 搜索 路 径 以 便 来 载 入 新 的 Class， 也 重新 生成 了 一 个 空白 的 cache( 当 然 ， 类 搜索 路 径 不 一 
定 必须 更 改 )。 这 个 方案 比较 实用 ， 我 们 几乎 不 用 做 什么 工作 ，java.netURLClassLoader 正 
是 一 个 符合 要 求 的 classloader， 我 们 可 以 直接 使 用 或 者 继承 它 就 可 以 了 。 

现在 我 们 能 够 动态 的 载 入 Class 了 ， 这 样 我 们 就 可 以 利用 newInstance 方法 来 获得 一 个 
Object。 但 我 们 如 何 将 此 Object 造型 呢 ? 可 以 将 此 Object 造型 成 它 本 身 的 Class 吗 ? 首先 
让 来 分 析 一 下 Java 源 文件 的 编译 和 运行 吧 。javac 命令 是 调用 JAVA_HOME/lib/toolsjar 中 
的 com.sun.tools.javac.Main 的 compile 方法 来 编译 : 


public static int compile(string as[]); 
public static int compile(String as[], PrintWriter printwriter); 


返回 0 表示 编译 成 功 ， 字 符 串 数组 as 则 是 我 们 用 javac 命令 编译 时 的 参数 ， 以 空格 划 
分 。 例 如 : 


jJavac -classpath c:/foo/bar.jar;. -d c:/c:/Some.java 


字符 串 数 组 as 为 {"-classpath","c://foo//bar.jar;.","-d","c://","c://Some.java"}， 如 果 带 有 
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PrintWriter 参数 ， 则 会 把 编译 信息 出 到 这 个 指定 的 PrintWriter 中 。 默 认 的 输出 是 
System.err。 

其 中 Main 是 由 JVM 使 用 Launcher 初始 化 的 system classloader 载 入 的 ， 根 据 全 盘 负 责 
原则 ， 编 译 器 在 解析 这 个 java 源 文件 时 所 发 现 的 它 所 依赖 和 引用 的 所 有 Class 也 将 由 
system classloader 载 入 ， 如 果 system classloader 不 能 载 入 某 个 Class 时 ， 编 译 器 将 抛 出 一 个 

“cannot resolve symbol” 错 误 。 

所 以 首先 编译 就 通 不 过 ， 也 就 是 编译 器 无 法 编译 一 个 引用 了 不 在 CLASSPATH 中 的 未 
知 Class 的 java 源 文件 ， 而 由 于 拼写 错误 或 者 没有 把 所 需 类 库 放 到 CLASSPATH 中 ， 大 家 
一 定 经 常 看 到 这 个 “cannot resolve symbol” 这 个 编译 错误 。 

其 次 ， 就 是 我 们 把 这 个 Class 放 到 编译 路 径 中 ， 成 功 地 进行 了 编译 ， 然 后 在 运行 的 时 
候 不 把 它 放 入 到 CLASSPATH 中 而 利用 我 们 自己 的 classloader 来 动态 载 入 这 个 Class， 这 
时 候 也 会 出 现 “javalangNoClassDefFoundError” 的 违例 ， 为 什么 呢 ? 我 们 再 来 分 析 一 
下 ， 首 先 调用 这 个 造型 语句 的 可 执行 的 Class 一 定 是 由 JVM 使 用 Launcher 初始 化 的 
system classloader 载 入 的 ， 根 据 全 盘 负责 原则 ， 当 我 们 进行 造型 的 时 候 ，JVM 也 会 使 用 
system classloader 来 尝试 载 入 这 个 Class 来 对 实例 进行 造型 ， 自 然 在 system classloader 寻找 
不 到 这 个 Class 时 就 会 抛 出 “java.lang.NoClassDefFoundError” 的 违例 。 

现在 让 我 们 来 总 结 一 下 ，Java 文件 的 编译 和 Class 的 载 入 执行 ， 都 是 使 用 Launcher 初 
始 化 的 system classloader 作为 类 载 入 器 的 ， 我 们 无 法 动态 的 改变 system classloader， 更 无 
法 让 JVM 使 用 我 们 自己 的 classloader 来 替换 system classloader， 根 据 全 盘 负责 原则 ， 就 限 
制 了 编译 和 运行 时 ， 我 们 无 法 直接 显 式 的 使 用 一 个 system classloader 寻找 不 到 的 Class， 即 
我 们 只 能 使 用 Java 核心 类 库 ， 扩 展 类 库 和 CLASSPATH 中 的 类 库 中 的 Class。 

再 尝试 一 下 这 种 情况 ， 我 们 把 这 个 Class 也 放 入 到 CLASSPATH 中 ， 让 system 
classloader 能 够 识别 和 载 入 。 然 后 我 们 通过 自己 的 classloader 来 从 指定 的 class 文件 中 载 入 
这 个 Class( 不 能 够 委托 parent 载 入 ， 因 为 这 样 会 被 system classloader 从 CLASSPATH 中 将 
其 载 入 )， 然 后 实例 化 一 个 Object， 并 造型 成 这 个 Class， 这 样 JVM 也 识别 这 个 Class( 因 为 
system classloader 能 够 定位 和 载 入 这 个 Class 从 CLASSPATH 中 )， 载 入 的 也 不 是 
CLASSPATH 中 的 这 个 Class， 而 是 从 CLASSPATH 外 动态 载 入 的 ， 这 样 总 行 了 吧 ! 十 分 
不 幸 的 是 ， 这 时 会 出 现 “java.lang.ClassCastException ”违例 ， 为 什么 呢 ? 

我 们 也 来 分 析 一 下 ， 不 错 ， 我 们 虽然 从 CLASSPATH 外 使 用 我 们 自己 的 classloader 动 
态 载 入 了 这 个 Class， 但 将 它 的 实例 造型 的 时 候 是 JVM 会 使 用 system classloader 来 再 次 载 
入 这 个 Class， 并 尝试 将 使 用 我 们 的 自己 的 classloader 载 入 的 Class 的 一 个 实例 造型 为 
system classloader 载 入 的 这 个 Class( 另 外 的 一 个 )。 大 家 发 现 什么 问题 了 吗 ? 也 就 是 我 们 尝 
试 将 从 一 个 classloader 载 入 的 Class 的 一 个 实例 造型 为 另外 一 个 classloader 载 入 的 Class， 
虽然 这 两 个 Class 的 名 字 一 样 ， 甚 至 是 从 同一 个 class 文件 中 载 入 。 但 不 幸 的 是 JVM 却 认 
为 这 两 个 Class 是 不 同 的 ， 即 JVM 认为 不 同 的 classloader 载 入 的 相同 的 名 字 的 Class( 即 使 
是 从 同一 个 Class 文件 中 载 入 的 ) 是 不 同 的 ! 这 样 做 的 原因 我 想 大 概 也 是 主要 出 于 安全 性 考 
虑 ， 这 样 就 保证 所 有 的 核心 Java 类 都 是 system classloader 载 入 的 ， 我 们 无 法 用 自己 的 
classloader 载 入 的 相同 名 字 的 Class 的 实例 来 蔡 换 它们 的 实例 。 


第 11 章 虚拟 机 类 的 加 载 机 制 


看 到 这 里 ， 聪 明 的 读者 一 定 想到 了 该 如 何 动态 载 入 我 们 的 Class， 实 例 化 ， 造 型 并 调用 
了 吧 ! 那 就 是 利用 面向 对 象 的 基本 特性 之 一 的 多 形 性 。 我 们 把 我 们 动态 载 入 的 Class 的 实 
例 造型 成 它 的 一 个 system classloader 所 能 识别 的 父 类 就 行 了 ! 这 是 为 什么 呢 ? 我 们 还 是 要 
再 来 分 析 一 次 。 当 我 们 用 我 们 自己 的 classloader 来 动态 载 入 这 我 们 只 要 把 这 个 Class 的 时 
候 ， 发 现 它 有 一 个 父 类 Class， 在 载 入 它 之 前 JVM 先 会 载 入 这 个 父 类 Class， 这 个 父 类 
Class 是 system classloader 所 能 识别 的 ， 根 据 委托 机 制 ， 它 将 由 system classloader 载 入 ， 然 
后 我 们 的 classloader 再 载 入 这 个 Class， 创 建 一 个 实例 ， 造 型 为 这 个 父 类 Class， 注 意 了 ， 
造型 成 这 个 父 类 Class 的 时 候 (也 就 是 上 漳 ) 是 面向 对 象 的 java 语言 所 允许 的 并 且 JVM 也 支 
持 的 ，JVM 就 使 用 system classloader 再 次 载 入 这 个 父 类 Class， 然 后 将 此 实例 造型 为 这 个 
父 类 Class。 大 家 可 以 从 这 个 过 程 发 现 这 个 父 类 Class 都 是 由 system classloader 载 入 的 ， 也 
就 是 同一 个 class loader 载 入 的 同一 个 Class， 所 以 造型 的 时 候 不 会 出 现任 何 异 常 。 而 根据 
多 形 性 ， 调 用 这 个 父 类 的 方法 时 ， 真 正 执行 的 是 这 个 Class( 非 父 类 Class) 的 覆盖 了 父 类 方 
法 的 方法 。 这 些 方法 中 也 可 以 引用 system classloader 不 能 识别 的 Class， 因 为 根据 全 盘 负 责 
原则 ， 只 要 载 入 这 个 Class 的 classloader 即 我 们 自己 定义 的 classloader 能 够 定位 和 载 入 这 
些 Class 就 行 了 。 

这 样 我 们 就 可 以 事先 定义 好 一 组 接口 或 者 基 类 并 放 入 CLASSPATH 中 ， 然 后 在 执行 的 
时 候 动态 的 载 入 实现 或 者 继承 了 这 些 接口 或 基 类 的 子 类 。 还 不 明白 吗 ? 让 我 们 来 想 一 想 
Servlet 吧 ，web application server 能 够 载 入 任何 继承 了 Servlet 的 Class 并 正确 的 执行 它们 ， 
不 管 它 实际 的 Class 是 什么 ， 就 是 都 把 它们 实例 化 成 为 一 个 Servlet Class， 然 后 执行 Servlet 
的 init、doPost、doGet 和 destroy 等 方法 的 ， 而 不 管 这 个 Servlet 是 从 web- inplib 下 由 
system classloader 的 子 classloader( 即 定制 的 classloader) 动 态 载 入 ， 还 是 从 web-inf/classes 
下 由 system classloader 的 子 classloader( 即 定制 的 classloader) 动 态 载 入 。 综 上 所 述 ， 在 
Applet 和 EJB 等 容器 中 都 是 采用 了 这 种 机 制 。 

classloader 虽然 称 为 类 加 载 器 ， 但 并 不 意味 着 只 能 用 来 加 载 Class， 我 们 还 可 以 利用 它 
也 获得 图 片 和 音频 文件 等 资源 的 URL， 当 然 这 些 资源 必须 在 CLASSPATH 中 的 jar 类 库 中 
或 目录 下 。 我 们 来 看 API 的 doc 中 关于 ClassLoader 的 两 个 寻找 资源 和 Class 的 方法 
描述 : 

public URL getResource (String name) 


可 以 通过 上 述 方法 指定 的 名 字 来 查找 资源 ， 一 个 资源 是 一 些 能 够 被 Class 代码 访问 的 
在 某 种 程度 上 依赖 于 代码 位 置 的 数据 (图 片 、 音 频 、 文 本 等 )。 

一 个 资源 的 名 字 是 以 “/” 号 分 隔 确定 资源 的 路 径 名 的 。 这 个 方法 将 先 请 求 parent 
classloader 搜索 资源 ， 如 果 没 有 parent， 则 会 在 内 置 在 虚拟 机 中 的 classloader( 即 bootstrap 
classloader) 路 径 中 搜索 。 如 果 失 败 ， 这 个 方法 将 调用 findResource(String) 来 寻找 资源 。 


public static URL getSystemResource (String name) 

从 用 来 载 入 类 的 搜索 路 径 中 查找 一 个 指定 名 字 的 资源 。 这 个 方法 使 用 system class 
loader 来 定位 资源 ， 即 相当 于 ClassLoader.getSystemClassLoader().getResource(name)。 
例如 : 


System.out.println (ClassLoader .getSystemResource ("java/lang/string.class")); 
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的 结果 为 : 


jar:file:/C:/j2sdkl1.6.23/jre/lib/rt.jar!/java/lang/string.class 


表明 String.class 文件 在 rtjar 的 java/lang 目录 中 。 

因此 可 以 将 图 片 等 资源 随同 Class 一 同 打包 到 jar 类 库 中 (当然 ， 也 可 单独 打包 这 些 资 
源 ) 并 添加 它们 到 class loader 的 搜索 路 径 中 ， 我 们 就 无 需 关 心 这 些 资源 的 具体 位 置 ， 让 
class loader 来 帮 有 我 们 寻找 了 ! 
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站 在 Java 虚拟 机 的 角度 讲 ， 只 存在 如 下 两 种 不 同 的 类 加 载 器 : 

(1) 启动 类 加 载 器 (Bootstrap ClassLoader)， 这 个 类 加 载 器 使 用 C++ 语言 实现 ， 是 虚拟 
机 自身 的 一 部 分 ; 

(2) 所 有 其 他 的 类 加 载 器 ， 这 些 类 加 载 器 都 由 Java 语言 实现 ， 独 立 于 虚拟 机 外 部 ， 并 
且 全 都 继承 自 抽 象 类 j ava.lang.ClassLoader。 

从 Java 开发 人 员 的 角度 来 看 ， 类 加 载 器 就 还 可 以 划分 得 更 细致 一 些 ， 绝 大 部 分 Java 
程序 都 会 使 用 到 以 下 三 种 系统 提供 的 类 加 载 器 。 

(1) 启动 类 加 载 器 (Bootstrap ClassLoader): 前 面 已 经 介绍 过 ， 这 个 类 加 载 器 负责 将 存 
放 在 <JAVA_HOME>Vib 目录 中 的 ， 或 者 被 -Xbootclasspath 参数 所 指定 的 路 径 中 的 ， 并 且 
是 虚拟 机 识别 的 ( 仅 按照 文件 名 识别 ， 如 rtjar， 名 字 不 符合 的 类 库 即使 放 在 lib 目录 中 也 不 
会 被 加 载 ) 类 库 加 载 到 虚拟 机 内 存 中 。 启 动 类 加 载 器 无 法 被 Java 程序 直接 引用 。 

(2) 扩展 类 加 载 器 (Extension ClassLoader): 这 个 加 载 器 由 sun.misc.Launcher$ExtClass 
Loader 实现 ， 它 负责 加 载 <JAVA_HOME>\lib\ext 目录 中 的 ， 或 者 被 java.ext.dirs 系统 变量 
所 指定 的 路 径 中 的 所 有 类 库 ， 开 发 者 可 以 直接 使 用 扩展 类 加 载 器 。 

(3) 应 用 程序 类 加 载 器 (Application ClassLoader): 这 个 类 加 载 器 由 
sun.misc.Launcher$ AppClassLoader 来 实现 。 由 于 这 个 类 加 载 器 是 ClassLoader 中 的 
getSystemClassLoader() 方 法 的 返回 值 ， 所 以 一 般 也 称 它 为 系统 类 加 载 器 。 它 负责 加 载 用 户 
类 路 径 (ClassPath) 上 所 指定 的 类 库 ， 开 发 者 可 以 直接 使 用 这 个 类 加 载 器 ， 如 果 应 用 程序 中 
没有 自 定义 过 自己 的 类 加 载 器 ， 一 般 情况 下 这 个 就 是 程序 中 默认 的 类 加 载 器 。 

我 们 的 应 用 程序 都 是 由 这 三 种 类 加 载 器 互相 配合 进行 加 载 的 ， 如 果 有 必要 ， 还 可 以 加 
入 自己 定义 的 类 加 载 器 。 

双亲 委派 模型 要 求 除了 顶层 的 启动 类 加 载 器 外 ， 其 余 的 类 加 载 器 都 应 当 有 自己 的 父 类 
加 载 器 。 这 里 类 加 载 器 之 间 的 父子 关系 一 般 不 会 以 继承 (Inheritance) 的 关系 来 实现 ， 而 是 都 
使 用 组 合 (Composition) 关 系 来 复 用 父 加 载 器 的 代码 。 

类 加 载 器 的 双亲 委派 模型 在 JDK 1.2 期 间 被 引入 并 被 广泛 应 用 于 之 后 几乎 所 有 的 Java 
程序 中 ， 但 它 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 Java 设计 者 们 推荐 给 开发 者 们 的 一 种 类 
加 载 器 实现 方式 。 

双亲 委派 模型 的 工作 过 程 是 : 如 果 一 个 类 加 载 器 收 到 了 类 加 载 的 请 求 ， 它 首先 不 会 自 
己 去 尝试 加 载 这 个 类 ， 而 是 把 这 个 请 求 委派 给 父 类 加 载 器 去 完成 ， 每 一 个 层次 的 类 加 载 器 
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都 是 如 此 ， 因 此 所 有 的 加 载 请 求 最 终 都 应 该 传送 到 顶层 的 启动 类 加 载 器 中 ， 只 有 当 父 加 载 
器 反馈 自己 无 法 完成 这 个 加 载 请 求 ( 它 的 搜索 范围 中 没有 找到 所 需 的 类 ) 时 ， 子 加 载 器 才 会 
尝试 自己 去 加 载 。 

使 用 双亲 委派 模型 来 组 织 类 加 载 器 之 间 的 关系 ， 有 一 个 显而易见 的 好 处 就 是 Java 类 随 
着 它 的 类 加 载 器 一 起 具备 了 一 种 带 有 优先 级 的 层次 关系 。 例 如 类 java.lang.Object， 它 存放 
在 rtjar 之 中 ， 无论 哪 一 个 类 加 载 器 要 加 载 这 个 类 ， 最 终 都 是 委派 给 启动 类 加 载 器 进行 加 
载 ， 因 此 Object 类 在 程序 的 各 种 类 加 载 器 环境 中 都 是 同一 个 类 。 相 反 ， 如 果 没 有 使 用 双亲 
委派 模型 ， 由 各 个 类 加 载 器 自行 去 加 载 的 话 ， 如 果 用 户 自 己 写 了 一 个 名 为 java.lang.Object 
的 类 ， 并 放 在 程序 的 ClassPath 中 ， 那 系统 中 将 会 出 现 多 个 不 同 的 Object 类 ，Java 类 型 体 
系 中 最 基础 的 行为 也 就 无 从 保证 ， 应 用 程序 也 将 会 变 得 一 片 混乱 。 如 果 您 有 兴趣 的 话 ， 可 
以 尝试 去 写 一 个 与 rtjar 类 库 中 已 有 类 重 名 的 Java 类 ， 将 会 发 现 可 以 正常 编译 ， 但 永远 无 
法 被 加 载运 行 。 

双亲 委派 模型 对 于 保证 Java 程序 的 稳定 运作 很 重要 ， 但 它 的 实现 却 非常 简单 ， 实 现 
双亲 委派 的 代码 都 集中 在 java.lang.ClassLoader 的 loadClass() 方 法 之 中 ， 看 看 下 面 的 演示 
代码 。 


protected synchronized Class<?> loadClass (String name，boolean resolve) 
throws 
ClassNotFoundException 


{ 

// 首 先 ， 检 查 请 求 的 类 是 否 已 经 被 加 载 过 了 
Class c=findLoadedClass (name)j 

if (c==null){ 

try{ 

if (parent! null) { 

c= parent.loadClass (name, false); 

} else if 

c= findBootstrapClassOrNull (name); 
} 

} catch (ClassNotFoundException e) { 
// 如 果 父 类 加 载 器 抛 出 classNotFoundException 
// 则 说 明 父 类 加 载 器 无 法 完成 加 载 请 求 

} 

if(c==null) { 

// 在 父 类 加 载 器 无 法 加 载 的 时 候 

// 再 调用 本 身 的 findclass 方法 来 进行 类 加 载 
c= findClass (name); 

} 

} 

if (resolve) { 

resolveClass (c); 

} 

TeEurn ot 


} 


11.3.4 ”破坏 双亲 委派 模型 
上 文 提 到 过 双亲 委派 模型 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 Java 设计 者 们 推荐 给 开 
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开发 : 
、 高 效 和 安全 的 最 优 
发 者 们 的 类 加 载 器 实现 方式 。 在 Java 的 世界 里 面 大 部 分 的 类 加 载 器 都 遵循 这 个 模型 ， 但 也 
有 例外 的 情况 ， 到 现在 为 止 ， 双 亲 委 派 模 型 主要 出 现 过 三 次 较 大 规模 的 “被 破坏 ”情况 。 

双亲 委派 模型 的 第 一 次 “被 破坏 ”其 实 发 生 在 双亲 委派 模型 出 现 之 前 一 一 即 JDK 1.2 
发 布 之 前 。 由 于 双亲 委派 模型 在 JDK 12 之 后 才 被 引入 的 ， 而 类 加 载 器 和 抽象 类 
java.lang.ClassLoader 则 在 JDK 1.0 时 代 就 已 经 存在 ， 面 对 已 经 存在 的 用 户 自 定义 类 加 器 的 
实现 代码 ，Java 设计 者 们 引入 双亲 委派 模型 时 不 得 不 做 出 一 些 妥 协 。 为 了 向 前 兼容 JDK 1.2 
之 后 的 java.lang.ClassLoader， 添 加 了 一 个 新 的 protected 方法 findClass()， 在 此 之 前 ， 用 户 
去 继承 java.lang.ClassLoader 的 唯一 目的 就 是 为 了 重 写 loadClass() 方 法 ， 为 虚拟 机 在 进行 类 
加 载 的 时 候 会 调用 加 载 器 的 私有 方法 loadClassIntemal0， 而 这 个 方法 的 唯一 逻辑 就 是 去 调 
用 自己 的 loadClass0。 

上 一 节 我 们 已 经 看 过 loadClass() 方 法 的 代码 ， 双 亲 委 派 的 具体 逻辑 就 实现 在 这 个 方法 
之 中 ，JDK 12 之 后 已 不 提倡 用 户 再 去 覆盖 loadClass() 方 法 ， 而 应 当 把 自己 的 类 加 载 逻辑 写 
到 findClass() 方 法 中 ， 在 loadClass() 方 法 的 逻辑 里 如 果 父 类 加 载 失败 ， 则 会 调用 自己 的 
findClass() 方 法 来 完成 加 载 ， 这 样 就 可 以 保证 新 写 出 来 的 类 加 载 器 是 符合 双亲 委派 规 
则 的 。 

双亲 委派 模型 的 第 二 次 “被 破坏 ”是 由 这 个 模型 自身 的 缺陷 所 导致 的 ， 双 亲 委 派 很 好 
地 解决 了 各 个 类 加 载 器 的 基础 类 的 统一 问题 ( 越 基础 的 类 由 越 上 层 的 加 载 器 进行 加 载 )， 基 
础 类 之 所 以 被 称 为 “基础 ”， 是 因为 它们 总 是 作为 被 用 户 代码 调用 的 API， 但 世事 往往 没 
有 绝对 的 完美 ， 如 果 基 础 类 又 要 调用 回 用 户 的 代码 ， 那 该 怎么 办 ? 

这 并 非 是 不 可 能 的 事情 ， 一 个 典型 的 例子 便 是 JNDI 服 务 ，JNDI 现在 已 经 是 Java 的 标 
准 服务 ， 它 的 代码 由 启动 类 加 载 器 去 加 载 (在 JDK 1.3 时 代 放 进去 的 rtjar)， 但 INDI 的 目的 
就 是 对 资源 进行 集中 管理 和 查找 ， 它 需要 调用 由 独立 厂商 实现 并 部 署 在 应 用 程序 的 
ClassPath 下 的 JNDI 接口 提供 者 (Service Provider Interface，SPD 的 代码 ， 但 启动 类 加 载 器 
不 可 能 “认识 ”这 些 代码 啊 ! 那 该 怎么 办 ? 

为 了 解决 这 个 困境 ，Java 设计 团队 只 好 引入 了 一 个 不 太 优雅 的 设计 : 线程 上 下 文 类 加 
载 器 (Thread Context ClassLoader) 。 这 个 类 加 载 器 可 以 通过 java.lang.Thread 类 的 
setContextClassLoaser() 方 法 进行 设置 ， 如 果 创建 线程 时 还 未 设置 ， 它 将 会 从 父 线程 中 继承 
一 个 ;如 果 在 应 用 程序 的 全 局 范围 内 都 没有 设置 过 ， 那 么 这 个 类 加 载 器 默认 就 是 应 用 程序 
类 加 载 器 。 

有 了 线程 上 下 文 类 加 载 器 ， 就 可 以 做 一 些 “ 舞 次 ”的 事情 了 ，JNDI 服务 使 用 这 个 线程 
上 下 文 类 加 载 器 去 加 载 所 需要 的 SPI 代码 ， 也 就 是 父 类 加 载 器 请 求 子 类 加 载 器 去 完成 类 加 
载 的 动作 ， 这 种 行为 实际 上 就 是 打通 了 双亲 委派 模型 的 层次 结构 来 逆向 使 用 类 加 载 器 ， 已 
经 违背 了 双亲 委派 模型 的 一 般 性 原则 ， 但 这 也 是 无 可 奈何 的 事情 。Java 中 所 有 涉及 SPI 的 
加 载 动作 基本 上 都 采用 这 种 方式 ， 例 如 JNDI、JDBC、JCE、JAXB 和 JBI 等 。 

双亲 委派 模型 的 第 三 次 “被 破坏 ”是 由 于 用 户 对 程序 动态 性 的 追求 而 导致 的 ， 这 里 所 
说 的 “动态 性 ” 指 的 是 当前 一 些 非常 “ 热 ” 门 的 名 词 : 代码 热 蔡 换 (HotSwap)、 模 块 热 部 署 
(Hot Deployment) 等 ， 说 白 了 就 是 希望 应 用 程序 能 像 我 们 的 电脑 外 设 那样 ， 插 上 鼠标 或 U 
盘 ， 不 用 重启 机 器 就 能 立即 使 用 ， 鼠 标 有 问题 或 要 升级 就 换个 鼠标 ， 不 用 停机 也 不 用 重 
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启 。 对 于 个 人 电脑 来 说 ， 重 启 一 次 其 实 没有 什么 大 不 了 的 ， 但 对 于 一 些 生产 系统 来 说 ， 关 
机 重启 一 次 可 能 就 要 被 列 为 生产 事故 ， 这 种 情况 下 热 部 署 就 对 软件 开发 者 ， 尤 其 是 企业 级 
软件 开发 者 具有 很 大 的 吸引 力 。 

在 JSR-297、JSR-277 规范 从 纸 上 标 准 变 成 真正 可 运行 的 程序 之 前 ，OSGi 是 当前 业界 
“事实 上 ”的 Java 模块 化 标准 ， 而 OSGi 实现 模块 化 热 部 署 的 关键 则 是 它 自 定义 的 类 加 载 
器 机 制 的 实现 。 每 一 个 程序 模块 (OSGi 中 称 为 Bundle) 都 有 一 个 自己 的 类 加 载 器 ， 当 需要 更 
换 一 个 Bundle 时 ， 就 把 Bundle 连同 类 加 载 器 一 起 换 掉 以 实现 代码 的 热 蔡 换 。 

在 OSGi 环境 下 ， 类 加 载 器 不 再 是 双亲 委派 模型 中 的 树 状 结构 ， 而 是 进一步 发 展 为 网 
状 结构 ， 当 收 到 类 加 载 请 求 时 ，OSGi 将 按照 下 面 的 顺序 进行 类 搜索 : 

(1) 将 以 java.* 开 头 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 

(2) 否则 ， 将 委派 列表 名 单 内 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 

(3) 否则 ， 将 Import 列表 中 的 类 ， 委 派 给 Export 这 个 类 的 Bundle 的 类 加 载 器 加 载 。 

(4) 否则 ， 查 找 当前 Bundle 的 ClassPath， 使 用 自己 的 类 加 载 器 加 载 。 

(5) 和 否则， 查找 类 是 否 在 自己 的 Fragment Bundle 中 ， 如 果 在 ， 则 委派 给 Fragment 
Bundle 的 类 加 载 器 加 载 。 

(6) 否则 ， 查 找 Dynamic Import 列表 的 Bundle， 委 派 给 对 应 Bundle 的 类 加 载 器 加 载 。 

(7) 否则 ， 类 查找 失败 。 

上 面 的 查找 顺序 中 只 有 开头 两 点 仍然 符合 双亲 委派 规则 ， 其 余 的 类 查找 都 是 在 平 级 的 
类 加 载 器 中 进行 的 。 

笔者 虽然 使 用 了 “被 破坏 ”这 个 词 来 形容 上 述 不 符合 双亲 委派 模型 原则 的 行为 ， 这 里 
“被 破坏 ”并 不 带 OSGi 的 感情 色彩 。 只 要 有 足够 意义 和 理由 ， 突 破 Java 的 原则 就 可 以 算 
作 一 种 创新 。 正 如 OSGi 中 的 类 加 载 器 并 不 符合 传统 的 双亲 委派 的 类 加 载 器 ， 并 且 业 界 对 
其 为 了 实现 热 部 署 而 带 来 的 额外 的 高 复杂 度 还 存在 不 少 争 议 ， 但 在 Java 程序 员 中 基本 有 一 
个 共识 : OSGi 中 对 类 加 载 器 的 使 用 是 很 值得 学 习 的 ， 弄 懂 了 OSGi 的 实现 ， 自 然 就 明白 了 
类 加 载 器 的 精粹 。 


11.3.5 ”开发 自己 的 类 加 载 器 


虽然 在 绝 大 多 数 情 况 下 ， 系 统 默认 提供 的 类 加 载 器 实现 已 经 可 以 满足 需求 。 但 是 在 某 
些 情 况 下 ， 您 还 是 需要 为 应 用 开发 出 自己 的 类 加 载 器 。 比 如 您 的 应 用 通过 网 络 来 传输 Java 
类 的 字 节 代码 ， 为 了 保证 安全 性 ， 这 些 字 节 代码 经 过 了 加 密 处 理 。 这 个 时 候 您 就 需要 自己 
的 类 加 载 器 来 从 某 个 网 络 地 址 上 读 取 加 密 后 的 字 节 代码 ， 接 着 进行 解密 和 验证 ， 最 后 定义 
出 要 在 Java 虚拟 机 中 运行 的 类 来 。 下 面 将 通过 两 个 具体 的 实例 来 说 明 类 加 载 器 的 开发 。 

1) 文件 系统 类 加 载 器 

第 一 个 类 加 载 器 用 来 加 载 存储 在 文件 系统 上 的 Java 字 节 代码 ， 完 整 的 实现 代码 如 下 。 


public class FileSystemClassLoader extends ClassLoader { 
private string rootDir; 
public FileSystemClassLoader (String rootDir) { 
this.rootDir = rootDir; 


fi odo 
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protected Class<?> findCclass (String name) throws 
ClassNotFoundException { 
byte[] classData = getClassData (name); 
if (classData == null) { 
throw new ClassNotFoundException(); 
村 
else { 
return defineClass (name, classData, 0, classData.length); 
1 
private byte[] getClassData (String className) { 
String path = classNameToPath (className); 
try { 
InputStream ins = new FileInputstream(path); 
ByteArrayOutputstream baos = new ByteRArrayOutputStream() 7 
int bufferSize = 4096; 
byte[] buffer = new byte[bufferSize]; 
int bytesNumRead = 0; 
while ((bytesNumRead = ins.read(buffer)) != -1) { 
baos .write (buffer, 0, bytesNumRead); 
} 
return baos.toByteArray (); 
} catch (IOException e) { 
e.printstackTrace (); 
} 
return null; 
# 
private String classNameToPath (String className) { 
return rootDir + File.separatorChar 
+ className.replace('.', File.separatorChar) + ".class"; 
} 


在 上 述 代 码 中 ， 类 FileSystemClassLoader 继承 自 类 java.lang.ClassLoader。 在 表 11-1 
中 列 出 的 java.lang.ClassLoader 类 的 常用 方法 中 ， 一 般 来 说 ， 自 己 开发 的 类 加 载 器 只 需要 
覆 写 findClass(String name) 方 法 即 可 。java.lang.ClassLoader 类 的 方法 loadClass0 封 装 了 前 
面 提 到 的 代理 模式 的 实现 。 该 方法 会 首先 调用 findLoadedClass() 方 法 来 检查 该 类 是 否 已 经 
被 加 载 过 ;， 如 果 没 有 加 载 过 的 话 ， 会 调用 父 类 加 载 器 的 loadClass() 方 法 来 尝试 加 载 该 类 ; 
如 果 父 类 加 载 器 无 法 加 载 该 类 的 话 ， 就 调用 findClass() 方 法 来 查找 该 类 。 因 此 ， 为 了 保证 
类 加 载 器 都 正确 实现 代理 模式 ， 在 开发 自己 的 类 加 载 器 时 ， 最 好 不 要 履 写 loadClass0 方 
法 ， 而 是 覆 写 findClass() 方 法 。 

类 FileSystemClassLoade 的 findClass() 方 法 首先 根据 类 的 全 名 在 硬盘 上 查找 类 的 字 节 代 
码 文件 (class 文件 )， 然 后 读 取 该 文件 内 容 ， 最 后 通过 defineClass() 方 法 来 把 这 些 字 节 代码 
转换 成 java.lang.Class 类 的 实例 。 

2) 网 络 类 加 载 器 

下 面 将 通过 一 个 网 络 类 加 载 器 来 说 明 如 何 通过 类 加 载 器 来 实现 组 件 的 动态 更 新 。 即 基 
本 的 场景 是 ，Java 字 节 代码 (.class) 文 件 存 放 在 服务 器 上 ， 客 户 端 通过 网 络 的 方式 获取 字 节 
代码 并 执行 。 当 有 版 本 更 新 的 时 候 ， 只 需要 蔡 换 掉 服务 器 上 保存 的 文件 即 可 。 通 过 类 加 载 
器 可 以 比较 简单 的 实现 这 种 需求 。 


KE 
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类 NetworkClassLoader 负责 通过 网 络 下 载 Java 类 字 节 代码 并 定义 出 Java 类 。 它 的 
实现 与 FileSystemClassLoader 类 似 。 在 通过 NetworkClassLoader 加 载 了 某 个 版 本 的 类 之 
后 ， 一 般 有 两 种 做 法 来 使 用 它 。 第 一 种 做 法 是 使 用 Java 反射 API。 另 外 一 种 做 法 是 使 用 
接口 。 需 要 注意 的 是 ， 并 不 能 直接 在 客户 端 代码 中 引用 从 服务 器 上 下 载 的 类 ， 因 为 客户 端 
代码 的 类 加 载 器 找 不 到 这 些 类 。 使 用 Java 反射 API 可 以 直接 调用 Java 类 的 方法 。 而 使 
用 接口 的 做 法 则 是 把 接口 的 类 放 在 客户 端 中 ， 从 服务 器 上 加 载 实现 此 接口 的 不 同 版 本 的 
类 。 在 客户 端 通过 相同 的 接口 来 使 用 这 些 实现 类 。 网 络 类 加 载 器 的 具体 代码 保存 在 本 书 售 
后 技术 持 的 群 共享 中 ， 欢 迎 读 者 下 载 使 用 。 


11.3.6 ”类 加 载 器 与 Web 容器 


对 于 运行 在 Java EE™ 容器 中 的 Web 应 用 来 说 ， 类 加 载 器 的 实现 方式 与 一 般 的 Java 
应 用 有 所 不 同 。 不 同 的 Web 容器 的 实现 方式 也 会 有 所 不 同 。 以 Apache Tomcat 来 说 ， 每 
个 Web 应 用 都 有 一 个 对 应 的 类 加 载 器 实例 。 该 类 加 载 器 也 使 用 代理 模式 ， 所 不 同 的 是 它 
是 首先 尝试 去 加 载 某 个 类 ， 如 果 找 不 到 再 代理 给 父 类 加 载 器 。 这 与 一 般 类 加 载 器 的 顺序 是 
相反 的 。 这 是 Java Servlet 规范 中 的 推荐 做 法 ， 其 目的 是 使 得 Web 应 用 自己 的 类 的 优先 
级 高 于 Web 容器 提供 的 类 。 这 种 代理 模式 的 一 个 例外 是 : Java 核心 库 的 类 是 不 在 查找 范 
围 之 内 的 。 这 也 是 为 了 保证 Java 核心 库 的 类 型 安全 。 
绝 大 多 数 情况 下 ，Web 应 用 的 开发 人 员 不 需要 考虑 与 类 加 载 器 相关 的 细节 。 下 面 给 出 
几 条 简单 的 原则 : 
口 每 个 Web 应 用 自己 的 Java 类 文件 和 使 用 的 库 的 jar 包 ， 分 别 放 在 WEB- 
INF/classes 和 WEB-INF/lib 目录 下 面 。 

口 “ 多 个 应 用 共享 的 Java 类 文件 和 jar 包 ， 分 别 放 在 Web 容器 指定 的 由 所 有 Web 
应 用 共享 的 目录 下 面 。 

口 “ 当 出 现 找 不 到 类 的 错误 时 ， 检 查 当 前 类 的 类 加 载 器 和 当前 线程 的 上 下 文 类 加 载 器 
是 否 正确 。 

介绍 完 类 加 载 器 与 Web 容器 的 关系 之 后 ， 下 面 介绍 它 与 OSGi 的 关系 。 


11.3.7 类 加 载 器 与 OSGi 


OSGi 是 Java 上 的 动态 模块 系统 。 它 为 开发 人 员 提 供 了 面向 服务 和 基于 组 件 的 运行 环 
境 ， 并 提供 标准 的 方式 用 来 管理 软件 的 生命 周期 。OSGi 已 经 被 实现 和 部 署 在 很 多 产品 
上 ， 在 开源 社区 也 得 到 了 广泛 的 支持 。Eclipse 就 是 基于 OSGi 技术 来 构建 的 。 

OSGi 中 的 每 个 模块 (Bundle) 都 包含 Java 包 和 类 。 模 块 可 以 声明 它 所 依赖 的 需要 导入 
(Imporb 的 其 他 模块 的 Java 包 和 类 (通过 Import-Package)， 也 可 以 声明 导出 (Export) 自 己 的 
包 和 类 ， 供 其 他 模块 使 用 (通过 Export-Package)。 也 就 是 说 需要 能 够 隐藏 和 共享 一 个 模块 
中 的 某 些 Java 包 和 类 。 这 是 通过 OSGi 特有 的 类 加 载 器 机 制 来 实现 的 。OSGi 中 的 每 个 
模块 都 有 对 应 的 一 个 类 加 载 器 。 它 负责 加 载 模块 自己 包含 的 Java 包 和 类 。 当 它 需 要 加 载 
Java 核心 库 的 类 时 (以 java 开头 的 包 和 类 )， 它 会 代理 给 父 类 加 载 器 (通常 是 启动 类 加 载 器 ) 
来 完成 。 当 它 需 要 加 载 所 导入 的 Java 类 时 ， 它 会 代理 给 导出 此 Java 类 的 模块 来 完成 加 
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载 。 模 块 也 可 以 显 式 的 声明 某 些 Java 包 和 类 ， 必 须 由 父 类 加 载 器 来 加 载 。 只 需要 设置 系 
统 属性 org.osgi.framework .bootdelegation 的 值 即 可 。 
假设 有 两 个 模块 bundleA 和 bundleB， 它 们 都 有 自己 对 应 的 类 加 载 器 classLoaderA 和 
classLoaderB 。 在 bundleA 中 包含 类 com.bundleA.Sample， 并 且 该 类 被 声明 为 导出 的 ， 也 
就 是 说 可 以 被 其 他 模块 所 使 用 的 。bundleB 声明 了 导入 bundleA 提供 的 类 com.bundleA. 
Sample， 并 包含 一 个 类 com.bundleB NewSample 继承 自 com.bundleA.Sample。 在 bundleB 
启动 的 时 候 ， 其 类 加 载 器 classLoaderB 需要 加 载 类 com.bundleB.NewSample， 进 而 需要 
加 载 类 com.bundleA.Sample。 由 于 bundleB 声明 了 类 com.bundleA.Sample 是 导入 的 ， 
classLoaderB 把 加 载 类 com.bundleA.Sample 的 工作 代理 给 导出 该 类 的 bundleA 的 类 加 载 
器 classLoaderA。classLoaderA 在 其 模块 内 部 查找 类 com.bundleA.Sample 并 定义 它 ， 所 得 
到 的 类 com.bundleA.Sample 实例 就 可 以 被 所 有 声明 导入 了 此 类 的 模块 使 用 。 对 于 以 java 
开头 的 类 ， 都 是 由 父 类 加 载 器 来 加 载 的 。 如 果 声 明了 系统 属性 org.osgi.framework- 
bootdelegation=com.example.core.*， 那 么 对 于 包 com.example.core 中 的 类 ， 都 是 由 父 类 加 
载 器 来 完成 的 。 
OSGi 模块 的 这 种 类 加 载 器 结构 ， 使 得 一 个 类 的 不 同 版 本 可 以 共存 在 Java 虚拟 机 中 ， 
带 来 了 很 大 的 灵活 性 。 不 过 它 的 这 种 不 同 ， 也 会 给 开发 人 员 带 来 一 些 麻烦 ， 尤 其 当 模块 需 
要 使 用 第 三 方 提供 的 库 的 时 候 。 下 面 提供 几 条 比较 好 的 建议 : 
口 ”如 果 一 个 类 库 只 有 一 个 模块 使 用 ， 把 该 类 库 的 jar 包 放 在 模块 中 ， 在 Bundle- 
ClassPath 中 指明 即 可 。 

口 ” 如 果 一 个 类 库 被 多 个 模块 共用 ， 可 以 为 这 个 类 库 单独 的 创建 一 个 模块 ， 把 其 他 模 
块 需要 用 到 的 Java 包 声 明 为 导出 的 。 其 他 模块 声明 导入 这 些 类 。 

口 ”如 果 类 库 提供 了 SPI 接口 ， 并 且 利 用 线程 上 下 文 类 加 载 器 来 加 载 SPI 实现 的 
Java 类 ， 有 可 能 会 找 不 到 Java 类 。 如 果 出 现 了 NoClassDefFoundError 异常 ， 首 
先 检 查 当 前 线程 的 上 下 文 类 加 载 器 是 否 正 确 。 通 过 
Thread.currentThread().getContextClassLoader() 就 可 以 得 到 该 类 加 载 器 。 该 类 加 载 
器 应 该 是 该 模块 对 应 的 类 加 载 器 。 如 果 不 是 的 话 ， 可 以 首先 通过 
class.getClassLoader() 来 得 到 模块 对 应 的 类 加 载 器 ， 再 通过 Thread.currentThread(). 
setContextClassLoader() 来 设置 当前 线程 的 上 下 文 类 加 载 器 。 
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执行 引擎 是 Jova 虚拟 机 最 核心 的 组 成 部 分 之 一 。“ 虚 拟 机 ”是 一 个 相对 
于 “物理 机 ”的 概念 ， 这 两 种 机 器 都 有 代码 执行 能 力 ， 其 区 别 是 物理 机 的 执行 
引擎 是 直接 建立 在 处 理 器 、 硬 件 、 指 令 集 和 操作 系统 层面 上 的 ， 而 虚拟 机 的 执 
行 引 警 则 是 由 自己 实现 的 。 本 章 将 讲解 从 栈 帧 、 方 法 调用 和 字 节 码 解释 执行 引 
擎 入 手 ， 详 细 讲 解 Java 虚拟 机 实现 高 效 处 理 的 基本 知识 。 


he 


12.1 虚拟 机 的 字 节 码 


Java 虚拟 机 一 般 是 用 软件 模拟 出 来 的 。 所 以 它 的 工作 机 制 相 对 硬件 机 器 有 如 下 三 点 不 同 。 

(1) 它 没有 寄存 器 ， 而 是 用 操作 数 栈 (Operand Stack) 来 代 蔡 ， 使 用 起 来 更 加 简单 。 

(2) 它 使 用 精简 指令 集 。 它 的 指令 集 相对 容易 掌握 。 

(3) 它 有 一 些 指 令 是 为 面向 对 象 而 设计 的 ， 比 如 它 有 一 个 指令 用 来 取出 指定 的 对 象 实 
例 的 某 个 字段 。 

在 Java 虚拟 机 规范 中 制定 了 虚拟 机 字 节 码 执行 引擎 的 概念 模型 ， 这 个 概念 模型 成 为 各 
种 虚拟 机 执行 引擎 的 统一 外 观 (Facade)。 在 不 同 的 虚拟 机 实现 里 面 ， 执 行 引擎 在 执行 Java 
代码 的 时 候 可 能 有 解释 执行 (通过 解释 器 执行 ) 和 编译 执行 (通过 即时 编译 器 产生 本 地 代码 执 
行 ) 两 种 选择 ， 也 可 能 两 者 兼备 ， 甚 至 还 可 能 包含 几 个 不 同 级 别 的 编译 器 执行 引擎 。 但 从 外 
观 上 看 起 来 ， 所 有 的 Java 虚拟 机 的 执行 引擎 都 是 一 致 的 ， 输入 的 是 字 节 码 文件 ， 处 理 过 程 
是 字 节 码 解 析 的 等 效 过 程 ， 输 出 的 是 执行 结果 。 本 章 将 主要 从 概念 模型 的 角度 来 讲解 虚拟 
机 的 方法 调用 和 字 节 码 执 行 。 

执行 引擎 在 执行 Java 代码 的 时 候 ， 可 以 选择 解释 执行 (通过 解释 器 执行 ) 和 编译 执行 ( 通 
过 即使 编译 器 产生 本 地 代码 执行 ) 两 种 选择 。 

栈 帧 (Stack Frame) 是 用 于 支持 虚拟 机 进行 方法 调用 和 方法 执行 的 数据 结构 ， 它 是 虚拟 
机 运行 时 数据 区 中 的 虚拟 机 栈 (Virtual Machine Stack) 的 栈 元 素 。 栈 帧 存储 了 方法 的 局 部 变 
量 表 ， 操 作 数 栈 ， 动 态 连接 和 方法 返回 地 址 等 信息 。 每 一 个 方法 调用 的 过 程 ， 就 对 应 着 一 
个 栈 帧 在 虚拟 机 栈 中 入 栈 到 出 栈 的 过 程 。 

一 个 线程 中 的 方法 调用 链 可 能 很 长 ， 很 多 方法 都 同时 处 于 执行 状态 ， 对 于 执行 引擎 来 
说 ， 活 动 线程 中 ， 只 有 栈 顶 的 栈 帧 是 有 效 的 ， 成 为 Current Stack Frame。 这 个 栈 帧 所 关联 
的 方法 称 为 当前 方法 (Current Method)。 执 行 引擎 所 运行 的 所 有 字 节 码 指令 都 只 针对 当前 栈 
帧 进行 操作 。 

在 虚拟 机 运行 时 ， 在 其 内 存 结构 中 的 栈 内 有 很 多 帧 。 每 个 帧 对 应 一 次 方法 执行 。 在 帧 
里 有 两 个 重要 的 数据 结构 : 操作 数 栈 和 局 部 变量 表 。 

1) 操作 数 栈 

操作 数 栈 是 用 来 存放 指令 的 参数 的 。 比 如 我 们 做 C=A+B， 先 把 A 放 进 操作 数 栈 ， 再 
把 B 放 进 去 ， 然 后 执行 一 个 加 法 指令 。 栈 里 的 A 和 B 会 被 清除 ，A+B 的 结果 被 放 进 栈 
里 。 再 来 一 个 指令 ， 把 栈 项 的 数据 放 到 C 变量 里 。 

我 们 知道 在 X86 系统 中 有 很 多 寄存 器 ， 例 如 EAX、EBX、ECX、EDX、ESP 等 等 ， 
要 掌握 每 个 寄存 器 的 用 途 还 真 需要 一 些 时 间 。 而 Java 虚拟 机 就 简单 多 了 ， 在 虚拟 机 中 你 看 
不 到 那么 多 寄存 器 概念 了 ， 如 果 说 有 ， 那 就 是 只 有 一 个 的 程序 指针 寄存 器 ， 用 来 指定 程序 
执行 到 的 代码 位 置 。 

2) 局 部 变量 表 

局 部 变量 表 里 存 放 局 部 变量 。 局 部 变量 的 个 数 是 在 编译 时 就 确定 的 ， 所 以 局 部 变量 表 
的 大 小 对 每 个 方法 来 说 是 确定 的 。 局 部 变量 表 里 的 变量 用 下 标 0、1、2、3 等 来 引用 。 
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下 面 我 们 借 个 例子 来 看 看 一 个 方法 是 如 何 被 执行 的 。 假 如 存在 下 面 一 个 方法 : 

void method (int a,int b){ 

int c=a+b; 

在 方法 调用 时 ， 局 部 变量 表 里 已 经 放 了 如 下 三 个 变量 : 

口 0: this 因为 这 个 方法 不 是 static 的 ， 它 属于 某 个 实例 ， 所 以 有 this 这 个 隐 含 的 局 

部 变量 。 

口 1: a。 

口 2: b。 

局 部 变量 表 的 大 小 是 4， 下 标 3 的 位 置 是 给 变量 c 使 用 的 。 上 边 的 Java 代码 会 被 编译 
成 字 节 码 ， 虚 拟 机 会 进行 如 下 执行 过 程 : 

iload 0 // 把 局 部 变量 整数 a 放 进 操作 数 栈 

iload 1 // 把 局 部 变量 整数 b 放 进 操作 数 栈 

iadqd // 把 栈 项 的 两 个 整数 加 起 来 ， 同 时 把 它们 从 栈 里 清除 掉 ， 把 结果 放 到 栈 顶 

istore_3 // 把 栈 顶 的 整数 放 到 局 部 变量 表 的 下 标 3 的 位 置 

javap 命令 可 以 用 来 反 汇 编 java class 文件 ， 可 以 看 到 字 节 码 和 局 部 变量 表 等 。 在 没有 
源 代码 的 情况 下 ， 使 用 javap 读 读 字 节 码 也 能 解决 一 些 问题 。 

除了 上 述 两 种 重要 的 数据 结构 外 ， 还 有 如 下 两 个 重要 的 概念 。 

1) 动态 连接 

每 个 栈 帧 都 包含 一 个 指向 运行 时 常量 池 中 该 栈 帧 所 属 方法 的 引用 ， 持 有 这 个 引用 是 为 
了 支持 方法 调用 过 程 中 的 动态 连接 。 

字 节 码 中 的 方法 调用 指令 就 以 常量 池 中 指向 方法 的 符号 引用 为 参数 。 这 些 符 号 引用 一 
部 分 会 在 类 加 载 阶段 或 第 一 次 使 用 的 时 候 转 换 为 直接 引用 ， 成 为 静态 解析 ， 另 一 部 分 会 在 
每 一 次 运行 时 转换 为 直接 引用 ， 成 为 动态 连接 。 

2) 方法 返回 地 址 

有 如 下 两 种 方式 退出 当前 执行 的 方法 : 

口 ”执行 引擎 遇 到 任意 一 个 方法 返回 的 字 节 码 指 令 ， 这 种 方法 称 为 正常 完成 出 口 ; 

口 “ 在 方法 执行 过 程 中 遇 到 无 法 处 理 的 异常 ， 这 种 方法 称 为 异常 完成 出 口 。 

无 论 哪 一 种 方法 ， 当 方法 退出 后 ， 都 需要 返回 到 调用 者 的 位 置 。 当 正常 退出 时 ， 调 用 
者 的 PC 计数 器 值 可 以 作为 返回 地 址 ， 栈 帧 中 很 可 能 会 保存 这 个 计数 器 值 ， 而 异常 退出 
时 ， 返 回 地 址 要 通过 异常 处 理 器 表 来 确定 。 

方法 退出 的 过 程 实 际 上 是 将 当前 栈 帧 出 战 ， 并 恢复 上 层 方 法 的 局 部 变量 表 和 操作 数 
栈 ， 把 返回 值 压 入 调用 者 的 操作 数 栈 中 。 


12.2 ” 栈 帧 的 结构 


在 本 节 将 要 讲解 的 是 JVM 运行 时 栈 帧 的 结构 ， 并 详细 讲解 操作 数 栈 和 局 部 变量 表 的 
基本 知识 ， 为 学 习 本 书后 面 的 知识 打下 基础 。 
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虚拟 机 开发 : 
衡 优 化 、 高 效 和 安全 的 最 优 方 案 


12.2.1 什么 是 栈 帧 


每 当 启 用 一 个 线程 时 ，JVM 就 为 他 分 配 一 个 Java 栈 ， 栈 是 以 帧 为 单位 保存 当前 线程 
的 运行 状态 。 某 个 线程 正在 执行 的 方法 称 为 当前 方法 ， 当 前 方法 使 用 的 栈 帧 称 为 当前 帧 ， 
当前 方法 所 属 的 类 称 为 当前 类 ， 当 前 类 的 常量 池 称 为 当前 常量 池 。 当 线程 执行 一 个 方法 
时 ， 它 会 跟踪 当前 常量 池 。 

每 当 线 程 调用 一 个 Java 方法 时 ，JVM 就 会 在 该 线程 对 应 的 栈 中 压 入 一 个 帧 ， 这 个 帧 
自然 就 成 了 当前 帧 。 当 执行 这 个 方法 时 ， 它 使 用 这 个 帧 来 存储 参数 、 局 部 变量 、 中 间 运 算 
结果 等 。 

Java 栈 上 的 所 有 数据 都 是 私有 的 。 任 何 线程 都 不 能 访问 另 一 个 线程 的 栈 数据 。 所 以 我 
们 不 用 考虑 多 线程 情况 下 栈 数据 访问 同步 的 情况 。 

像 方法 区 和 堆 一 样 ，Java 栈 和 帧 在 内 存 中 也 不 必 是 连续 的 ， 帧 可 以 分 布 在 连续 的 栈 
里 ， 也 可 以 分 布 在 堆 里 。 

栈 帧 (Stack Frame) 是 用 于 支持 虚拟 机 进行 方法 调用 和 方法 执行 的 数据 结构 ， 是 虚拟 机 
运行 时 数据 区 中 的 虚拟 机 栈 (Virtual Machine Staclo) 的 栈 元 素 。 栈 帧 存储 了 方法 的 局 部 变量 
表 、 操 作 数 栈 、 动 态 连接 和 方法 返回 地 址 等 信息 。 每 一 个 方法 从 调用 开始 到 执行 完成 的 过 
程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 栈 里 面 从 入 栈 到 出 栈 的 过 程 。 

每 一 个 栈 帧 都 包括 了 局 部 变量 表 、 操 作 数 栈 、 动 态 连 接 、 方 法 返回 地 址 和 一 些 额外 的 
附加 信息 。 在 编译 程序 代码 的 时 候 ， 栈 帧 中 需要 多 大 的 局 部 变量 表 、 多 深 的 操作 数 栈 都 已 
经 完全 确定 了 ， 并 且 写 入 到 方法 表 的 Code 属性 中 的 标记 @ 后 面 ， 因 此 一 个 栈 帧 需要 分 配 
多 少 内 存 ， 不 会 受到 程序 运行 期 变量 数据 的 影响 ， 而 仅仅 取决 于 具体 的 虚拟 机 实现 。 

一 个 线程 中 的 方法 调用 链 可 能 会 很 长 ， 很 多 方法 都 同时 处 于 执行 状态 。 对 于 执行 引擎 
来 讲 ， 活 动 线程 中 ， 只 有 栈 顶 的 栈 帧 是 有 效 的 ， 称 为 当前 栈 帧 (Current Stack Frame)， 这 个 
栈 帧 所 关联 的 方法 称 为 当前 方法 (Current Method)。 执 行 引擎 所 运行 的 所 有 字 节 码 指令 都 只 
针对 当前 栈 帧 进行 操作 ， 栈 帧 的 概念 结构 如 图 12-1 所 示 。 


当前 栈 帧 
Curr ent Stack Frame 


局 部 变量 表 
Local Variable Table 


操作 数 栈 
Operand Stack 


动态 连接 
Dynamic Linking 


返回 地 址 
Retum Address 


栈 帧 n 
Stack Frame n 


栈 帧 2 
Stack Frame 2 


栈 帧 1 
Stack Frame 1 


图 12-1 栈 帧 的 概念 结构 


第 12 章 研究 高 效 之 魂 


下 面 详 细 讲解 栈 帧 中 的 局 部 变量 表 、 操 作 数 栈 、 动 态 连 接 、 方 法 返回 地 址 等 各 个 部 分 
的 作用 和 数据 结构 。 


12.2.2 局 部 变量 表 


1) 局 部 变量 

局 部 变量 (Local Variable) 是 指 作用 域 和 生命 周期 都 局 限 在 所 在 函数 或 过 程 范围 内 的 变 
量 ， 它 是 相对 于 全 局 变量 (Global Variable) 而 言 的 。 编 译 器 在 为 局 部 变量 分 配 空间 时 通常 有 
两 种 做 法 : 使 用 寄存 器 和 使 用 栈 。 

寄存 器 的 访问 速度 快 ， 但 数量 和 空间 有 限 ， 所 以 像 字符 串 或 数组 不 适合 分 配 在 寄存 器 
中 。 编 译 器 通常 只 会 把 频繁 使 用 的 临时 变量 分 配 在 寄存 器 中 ， 比 如 for 循环 中 的 循环 变 
量 。 当 编译 器 的 优化 选项 打开 时 ， 编 译 器 会 充分 利用 可 用 的 寄存 器 来 给 临时 变量 使 用 ， 以 
提高 程序 的 性 能 。 对 于 调试 版 本 ， 优 化 选项 默认 是 关闭 的 ， 编 译 器 会 在 栈 上 分 配 所 有 的 变 
量 。 在 C/C++ 程序 中 ， 可 以 在 声明 变量 时 加 上 register 关键 字 ， 请 求 编译 器 在 可 能 的 情况 
下 将 该 变量 分 配 在 寄存 器 中 ， 但 不 能 保证 所 描述 的 变量 一 定 被 分 配 在 就 存 寄存 器 中 。 大 多 
数 时 候 ， 编 译 器 还 是 根据 全 局 设置 和 编译 器 自身 的 逻辑 来 决定 是 否 把 一 个 变量 分 配 在 寄存 
器 中 。 

编译 器 会 在 编译 阶段 根据 变量 的 特征 和 优化 选项 为 每 个 局 部 变量 选择 以 上 两 种 分 配方 
法 之 一 。 大 多 数 的 局 部 变量 都 是 分 配 在 栈 上 的 。 栈 上 的 变量 会 随 着 函数 的 调用 和 返回 而 自 
动 分 配 和 释放 ， 所 以 栈 有 时 也 称 为 自动 内 存 。 

局 部 变量 的 分 配 和 释放 是 由 编译 器 插入 的 代码 通过 调整 栈 指针 (Stack Pointer) 的 位 置 来 
完成 。 编 译 器 在 编译 时 ， 会 计算 当前 的 代码 块 中 所 声明 的 所 有 局 部 变量 所 需要 的 空间 ， 并 
将 其 按照 内 存 对 齐 要 求 的 最 接近 整数 值 。 在 32 位 系统 中 ， 内 存 分 配 时 按 4 字 节 对 齐 的 ， 
这 意味 着 不 满 4 字 节 的 空间 会 按 4 字 节 来 分 配 。 

计算 好 所 需 的 空间 后 ， 编 译 器 会 插入 适当 的 指令 来 调整 栈 指针 ESP， 为 局 部 变量 分 配 
空间 ， 有 两 种 方式 调整 ESP 的 值 ， 一 种 是 直接 进行 加 减 运算 ， 另 一 种 是 PUSH 和 POP 
指令 。 

当 我 们 看 到 反 汇 编 代 码 时 ， 常 见 到 的 指令 是 esp+n 这 种 相对 的 地 址 ， 用 esp 进行 标注 
的 缺点 是 ESP 的 值 是 不 稳定 的 ， 当 ESP 的 值 变化 了 ， 引 用 变量 的 偏 移 值 也 要 变化 。 为 了 
解决 以 上 问题 ，x86 CPU 设计 了 另 一 个 寄存 器 ， 这 就 是 EBP 寄存 器 。EBP 的 全 称 是 
Extended Base Pointer， 即 扩展 的 基地 址 指针 。 使 用 EBP 寄存 器 ， 函 数 可 以 把 自己 将 要 使 
用 的 栈 空间 的 基准 地 址 记录 下 来 ， 然 后 使 用 这 个 基地 址 来 引用 局 部 变量 和 参数 。 在 同一 函 
数 内 ，EBP 寄存 器 的 值 是 保持 不 变 的 ， 这 样 函数 的 局 部 变量 就 有 了 一 个 固定 的 参照 物 。 

通常 ， 一 个 函数 在 入 口 处 将 当时 的 EBP 值 压 入 堆栈 ， 然 后 把 ESP 值 ( 栈 项 ) 赋 值 给 
EBP， 这 样 EBP 中 的 地 址 就 是 进入 本 函数 时 的 栈 项 地 址 。 因 此 在 EBP 地 址 的 上 面 便 是 这 
个 函数 使 用 的 栈 空 间 ， 它 下 面 (地 址 值 递增 方向 ) 是 父 函 数 使 用 的 空间 例如 EBP+4 指向 的 是 
CALL 指令 压 入 函数 的 返回 地 址 。EBP+8 是 父 函 数 压 在 栈 上 的 第 一 个 参数 ，EBP+0xC 是 第 
二 个 参数 。 依 次 类 推 ，EBP-n 是 第 一 个 局 部 变量 的 起 始 地 址 (n 为 变量 的 长 度 )。 

因为 在 将 栈 顶 地 址 ESP) 赋 给 EBP 寄存 器 之 前 先 把 旧 的 EBP 值 保 存在 栈 中 ， 所 以 EBP 
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寄存 器 所 指向 的 栈 单元 中 保存 的 是 前 一 个 EBP 寄存 器 的 值 ， 这 通常 也 就 是 父 函 数 的 EBP 
值 。 类 似 的 父 函数 的 EBP 所 指向 的 栈 单元 中 保存 的 是 更 上 一 层 函 数 的 EBP 值 ， 依 此 类 
推 ， 直 到 当前 线程 的 最 顶层 函数 。 这 也 正 是 栈 回溯 的 基本 原理 。 

2) 局 部 变量 表 

局 部 变量 表 是 一 组 变量 值 存储 空间 ， 用 于 存放 方法 参数 和 方法 内 部 定义 的 局 部 变量 。 
在 Java 程序 被 编译 为 Class 文件 时 ， 就 在 方法 的 Code 属性 的 max locals 数据 项 中 确定 了 该 
方法 所 需要 分 配 的 最 大 局 部 变量 表 的 容量 。 

局 部 变量 表 的 容量 以 变量 槽 (Variable Slot， 下 称 Slot) 为 最 小 单位 ， 虚 拟 机 规范 中 并 没 
有 明确 指明 一 个 Slot 应 占用 的 内 存 空 间 大 小 ， 只 是 很 有 “导向 性 ”地 说 明 每 个 Slot 都 应 该 
能 存放 一 个 boolean、byte、char、short、mt、float、reference 或 retumAddress 类 型 的 数 
据 ， 这 种 描述 与 明确 指出 “每 个 Slot 占用 32 位 长 度 的 内 存 空间 ”有 一 些 差别 ， 它 允许 
Slot 的 长 度 随 着 处 理 器 、 操 作 系 统 或 虚拟 机 的 不 同 而 发 生变 化 。 不 过 无 论 如 何 ， 即 使 在 64 
位 虚拟 机 中 使 用 了 64 位 长 度 的 内 存 空间 来 实现 一 个 Slot， 虚 拟 机 仍 要 使 用 对 齐 和 补 白 的 手 
段 让 Slot 在 外 观 上 看 起 来 与 32 位 虚拟 机 中 的 一 致 。 

既然 前 面 提 到 了 数据 类 型 ， 在 此 顺便 说 一 下 ， 一 个 Slot 可 以 存放 一 个 32 位 以 内 的 数 
据 类 型 ，Java 中 占用 32 位 以 内 的 数据 类 型 有 boolean、byte、char、short、int、float、 
reference 和 retumAddress 八 种 类 型 。 前 面 六 种 不 需要 多 加 解释 ， 大 家 都 认识 ， 而 后 面 的 
reference 是 对 象 的 引用 。 虚 拟 机 规范 既 没有 说 明 它 的 长 度 ， 也 没有 明确 指出 这 个 引用 应 有 
怎样 的 结构 ， 但 是 一 般 来 说 ， 虚 拟 机 实现 至 少 都 应 当 能 从 此 引用 中 直接 或 间接 地 查找 到 对 
象 在 Java 堆 中 的 起 始 地 址 索引 和 方法 区 中 的 对 象 类 型 数据 。 而 retumAddress 是 为 字 节 码 
指令 jsr、jsr_w 和 ret 服务 的 ， 它 指向 了 一 条 字 节 码 指令 的 地 址 。 

对 于 64 位 的 数据 类 型 ， 虚 拟 机 会 以 高 位 在 前 的 方式 为 其 分 配 两 个 连续 的 Slot 空间 。 

Java 语言 中 明确 规定 的 64 位 的 数据 类 型 只 有 long 和 double 两 种 (reference 类 型 则 可 能 
是 32 位 也 可 能 是 64 位 )。 值 得 一 提 的 是 ， 这 里 把 long 和 double 数据 类 型 分 割 存储 的 做 法 
与 “long 和 double 的 非 原子 性 协定 ”中 把 一 次 long 和 double 数据 类 型 读 写 分 割 为 两 次 32 
位 读 写 的 做 法 类 似 ， 读 者 阅读 到 Java 内 存 模型 时 可 以 对 比 一 下 。 不 过 ， 由 于 局 部 变量 表 建 
立 在 线程 的 堆栈 上 ， 是 线程 私有 的 数据 ， 无 论 读 写 两 个 连续 的 Slot 是 否 是 原子 操作 ， 都 不 
会 引起 数据 安全 问题 。 

虚拟 机 通过 索引 定位 的 方式 使 用 局 部 变量 表 ， 索 引 值 的 范围 是 从 0 开始 到 局 部 变量 表 
最 大 的 Slot 数量 。 如 果 是 32 位 数据 类 型 的 变量 ， 索 引 ，z 就 代表 了 使 用 第 z 个 Slot， 如 果 
是 64 位 数据 类 型 的 变量 ， 则 说 明 要 使 用 第 z 和 第 n+l 两 个 Slot。 

在 方法 执行 时 ， 虚 拟 机 是 使 用 局 部 变量 表 完 成 参数 值 到 参数 变量 列表 的 传递 过 程 的 ， 
如 果 是 实例 方法 ( 非 static 的 方法 )， 那 么 局 部 变量 表 中 第 0 位 索引 的 Slot 默认 是 用 于 传递 方 
法 所 属 对 象 实例 的 引用 ， 在 方法 中 可 以 通过 关键 字 “this” 来 访问 这 个 隐 含 的 参数 。 其 余 
参数 则 按照 参数 表 的 顺序 来 排列 ， 占 用 从 1 开始 的 局 部 变量 Slot， 参 数 表 分 配 完 毕 后 ， 再 
根据 方法 体内 部 定义 的 变量 顺序 和 作用 域 分 配 其 余 的 Slot。 

局 部 变量 表 中 的 Slot 是 可 重用 的 ， 方 法 体 中 定义 的 变量 ， 其 作用 域 并 不 一 定 会 覆盖 整 
个 方法 体 ， 如 果 当 前 字 节 码 PC 计数 器 的 值 已 经 超出 了 某 个 变量 的 作用 域 ， 那 么 这 个 变量 
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对 应 的 Slot 就 可 以 交 给 其 他 变量 使 用 。 这 样 的 设计 不 仅仅 是 为 了 节省 栈 空间 ， 在 某 些 情况 
下 Slot 的 复 用 会 直接 影响 到 系统 的 垃圾 收集 行为 ， 请 看 下 面 的 演示 代码 。 


public static void main(string[] args) () { 
bytefl placeholder = new byte[64 * 1024 * 1024] ; 
System.gc () ; 
} 


上 述 演示 代码 代码 非常 简单 ， 功 能 是 向 内 存 填充 了 64MB 的 数据 ， 然 后 通知 虚拟 机 进 
行 垃圾 收集 。 我 们 在 虚拟 机 运行 参数 中 加 上 “-verbose:gc ”来 看 看 垃圾 收集 的 过 程 ， 发 现 
在 System.gc0 运 行 后 并 没有 回收 这 64MB 的 内 存 ， 下 面 是 运行 的 结果 : 

[GC 66846K->65824K(125632K), 0.0032678 secs] 
[Full GC 65824K->65746K(125632K), 0.0064131 secs] 

没有 回收 placeholder 所 占 的 内 存 能 说 得 过 去 ， 因 为 在 执行 System.gc() 时 ， 变 量 
placeholder 还 处 于 作用 域 之 内 ， 虚 拟 机 自然 不 敢 回收 placeholder 的 内 存 。 我 们 把 代码 修改 
一 下 ， 变 成 如 下 演示 代码 。 

public static void main(String[] args) () { 


{ 
byte[] Placeholder = new byte[64 * 1024 * 1024] ; 


System.gc ( ) : 
} 

加 入 了 花 括 号 之 后 ，placeholder 的 作用 域 被 限制 在 花 括号 之 内 ， 从 代码 逻辑 上 讲 ， 在 
执行 System.gcO 的 时 候 ，placeholder 已 经 不 可 能 再 被 访问 了 ， 但 执行 一 下 这 段 程 序 ， 会 发 
现 运行 结果 如 下 ， 还 是 有 64MB 的 内 存 没 有 被 回收 ， 这 又 是 为 什么 呢 ? 

[GC 66846K->65888K(125632K) ,0.0009397 secs] 
[Full GC 65888K->65746:K (125632K), 0.0051574 secs] 

在 解释 为 什么 之 前 ， 我 们 先 对 这 段 代码 进行 第 二 次 修改 ， 在 调用 System.gc0 之 前 加 入 
一 行 代 码 “int a=0;”， 变 成 如 下 演示 代码 。 

public static void main(string[] args) () { 


{ 
byte[] placeholder = new byte[64 * 1024 * 1024] ; 
} 
int a= 0; 
System.gc ( ); 
} 


这 个 修改 看 起 来 很 莫名 其 妙 ， 但 运行 一 下 程序 ， 却 发 现 这 次 内 存 真 的 被 正确 回收 了 : 


[GC 664 01K- >65778K (12 5632K), 0.00354 71 secs] 
[Full GC 65778K->2181 《125632K),0.0140596 secsJ 


在 上 述 三 段 演示 代码 中 ，placeholder 能 否 被 回收 的 根本 原因 就 是 : 局 部 变量 表 中 的 
Slot 是 否 还 存 有 关于 placeholder 数组 对 象 的 引用 。 在 第 一 次 修改 中 ， 代 码 虽然 已 经 离开 了 
placeholder 的 作用 域 ， 但 在 此 之 后 ， 没 有 任何 对 局 部 变量 表 的 读 写 操作 ，placeholder 原本 
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所 占用 的 Slot 还 没有 被 其 他 变量 所 复 用 ， 所 以 作为 GC Roots 一 部 分 的 局 部 变量 表 仍然 保 
持 着 对 它 的 关联 。 这 种 关联 没有 被 及 时 打 断 ， 在 绝 大 部 分 情况 下 影响 都 很 轻微 。 但 如 果 遇 
到 一 个 方法 ， 其 后 面 的 代码 有 一 些 耗 时 很 长 的 操作 ， 而 前 面 又 定义 了 占用 了 大 量 内 存 、 实 
际 上 已 经 不 会 再 被 使 用 的 变量 ， 手 动 将 其 设置 为 null 值 (用 来 代替 “int a-0:”， 把 变量 对 
应 的 局 部 变量 表 Slot 清空 ) 就 不 是 一 个 毫 无 意义 的 操作 ， 这 种 操作 可 以 作为 一 种 在 极 特殊 
情形 (对 象 占用 内 存 大 、 此 方法 的 栈 帧 长 时 间 不 能 被 回收 、 方 法 调用 次 数 达 不 到 JIT 的 编译 
条 件 ) 下 的 “ 奇 技 ”来 使 用 。 但 不 应 当 对 赋 null 值 操作 有 过 多 的 依赖 ， 也 没有 必要 把 它 当做 
一 个 普遍 的 编码 方法 来 推广 。 以 恰当 的 变量 作用 域 来 控制 变量 回收 时 间 才 是 最 优雅 的 解决 
方法 ， 如 上 述 第 三 段 代码 那样 的 场景 并 不 多 见 。 

另外 ， 赋 null 值 的 操作 在 经 过 虚拟 机 JIT 编译 器 优化 之 后 会 被 消除 掉 ， 这 时 候 将 变量 
设置 为 null 实际 上 是 没有 意义 的 。 字 节 码 被 编译 为 本 地 代码 后 ， 对 GC Roots 的 枚 举 也 与 
解释 执行 时 期 有 所 差别 。 上 述 第 二 段 代码 在 经 过 JIT 编译 后 ，System.gc0 执 行 时 就 可 以 正 
确 地 回收 掉 内 存 ， 而 无 需 写成 上 述 第 三 段 代 码 的 样子 。 

关于 局 部 变量 表 ， 还 有 一 点 可 能 会 对 实际 开发 产生 影响 ， 就 是 局 部 变量 不 像 前 面 介 绍 
的 类 变量 那样 存在 “准备 阶段 ”。 通 过 前 一 章 的 讲解 ， 我 们 已 经 知道 类 变量 有 两 次 赋 初 始 
值 的 过 程 ， 一 次 在 准备 阶段 ， 赋 予 系 统 初始 值 ， 另 外 一 次 在 初始 化 阶段 ， 赋 予 程序 员 定义 
的 初始 值 。 因 此 即使 在 初始 化 阶段 程序 员 没 有 为 类 变量 赋值 也 没有 关系 ， 类 变量 仍然 具有 
一 个 确定 的 初始 值 。 但 局 部 变量 就 不 一 样 了 ， 如 果 一 个 局 部 变量 定义 了 但 没有 赋 初 始 值 是 
不 能 使 用 的 。 所 以 不 要 认为 Java 中 任何 情况 下 都 存在 诸如 整 型 变量 默认 为 0、 布 尔 型 变量 
默认 为 false 之 类 的 默认 值 。 正 如 下 面 的 演示 代码 所 示 ， 这 段 代码 其 实 并 不 能 运行 ， 所 幸 编 
译 器 能 在 编译 期 间 检查 到 并 提示 这 一 点 。 即 便 编译 器 能 通过 手动 生成 字 节 码 的 方式 制造 出 
下 面 的 代码 效果 ， 字 节 码 检验 的 时 候 也 会 被 虚拟 机 发 现 ， 从 而 导致 类 加 载 失败 。 


public static void main(String[] args) { 
int a; 

System.out.println (a)j 

) 


12.2.3 ”操作 数 栈 


操作 数 栈 也 被 称 为 操作 栈 ， 是 一 个 后 入 先 出 栈 。 同 局 部 变量 表 一 样 ， 操 作 数 栈 的 最 大 
深度 也 在 编译 的 时 候 被 写 入 到 Code 属性 的 max_stacks 数据 项 之 中 。 操 作 数 栈 的 每 一 个 元 
素 可 以 是 任意 的 Java 数据 类 型 ， 包 括 long 和 double。32 位 数据 类 型 所 占 的 栈 容量 为 1， 
64 位 数据 类 型 所 占 的 栈 容量 为 2。 在 方法 执行 的 任何 时 候 ， 操 作 数 栈 的 深度 都 不 会 超过 在 
max-stacks 数据 项 中 设 定 的 最 大 值 。 

当 一 个 方法 刚刚 开始 执行 的 时 候 ， 这 个 方法 的 操作 数 栈 是 空 的 ， 在 方法 的 执行 过 程 
中 ， 会 有 各 种 字 节 码 指令 向 操作 数 栈 中 写 入 和 提取 内 容 ， 也 就 是 入 栈 出 栈 操 作 。 例 如 在 做 
算术 运算 的 时 候 是 通过 操作 数 栈 来 进行 的 ， 又 或 者 在 调用 其 他 方法 的 时 候 是 通过 操作 数 栈 
来 进行 参数 传递 的 。 

举 个 例子 ， 整 数 加 法 的 字 节 码 指令 iadd 在 运行 的 时 候 要 求 操 作 数 栈 中 最 接近 栈 顶 的 两 
个 元 素 已 经 存 入 了 两 个 int 型 的 数值 ， 当 执行 这 个 指令 时 ， 会 将 这 两 个 int 值 出 栈 并 相 加 ， 
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然后 将 相 加 的 结果 入 栈 。 


操作 数 栈 中 元 素 的 数据 类 型 必须 与 字 节 码 指令 的 序列 严格 匹配 ， 在 编译 程序 代码 的 时 
候 ， 编 译 器 要 严格 保证 这 一 点 ， 在 类 校 验 阶段 的 数据 流 分 析 中 还 要 再 次 验证 这 一 点 。 再 以 
上 面 的 iadd 指令 为 例 ， 这 个 指令 用 于 整 型 数 加 法 ， 它 在 执行 时 ， 最 接近 栈 顶 的 两 个 元 素 的 
数据 类 型 必须 为 int 型 ， 不 能 出 现 一 个 long 和 一 个 float 使 用 iadd 命令 相 加 的 情况 。 

另外 ， 在 概念 模型 中 ， 两 个 栈 帧 作为 虚拟 机 栈 的 元 素 ， 相 互 之 间 是 完全 独立 的 。 但 是 
大 多 数 虚 拟 机 的 实现 里 都 会 做 一 些 优化 处 理 ， 令 两 个 栈 帧 出 现 一 部 分 重 琶 。 让 下 面 栈 帧 的 
部 分 操作 数 栈 与 上 面 栈 帧 的 部 分 局 部 变量 表 重 且 在 一 起 ， 这 样 在 进行 方法 调用 时 就 可 以 共 
用 一 部 分 数据 ， 而 无 须 进行 额外 的 参数 复制 传递 了 。 

Java 虚拟 机 的 解释 执行 引擎 称 为 “基于 栈 的 执行 引擎 ”， 其 中 所 指 的 “ 栈 ” 就 是 操作 
数 栈 。 


12.2.4 动态 连接 


每 个 栈 帧 都 包含 一 个 指向 运行 时 常量 池 中 该 栈 帧 所 属 方法 的 引用 ， 持 有 这 个 引用 是 为 
了 支持 方法 调用 过 程 中 的 动态 连接 。 我 们 知道 Class 文件 的 常量 池 中 存 有 大 量 的 符号 引 
用 ， 字 节 码 中 的 方法 调用 指令 就 以 常量 池 中 指向 方法 的 符号 引用 为 参数 。 这 些 符 号 引用 一 
部 分 会 在 类 加 载 阶 段 或 第 一 次 使 用 的 时 候 转 化 为 直接 引用 ， 这 种 转化 称 为 静态 解析 。 另 外 
一 部 分 将 在 每 一 次 的 运行 期 间 转化 为 直接 引用 ， 这 部 分 称 为 动态 连接 。 


12.2.5 方法 返回 地 址 


当 一 个 方法 被 执行 后 ， 有 如 下 两 种 方式 退出 这 个 方法 。 

(1) 执行 引擎 遇 到 任意 一 个 方法 返回 的 字 节 码 指令 ， 这 时 候 可 能 会 有 返回 值 传递 给 上 
层 的 方法 调用 者 (调用 当前 方法 的 方法 称 为 调用 者 )， 是 否 有 返回 值 和 返回 值 的 类 型 将 根据 
遇 到 何 种 方法 返回 指令 来 决定 ， 这 种 退出 方法 的 方式 称 为 正常 完成 出 口 (Normal Method 
Invocation Completion ) 。 

(2) 在 方法 执行 过 程 中 遇 到 了 异常 ， 并 且 这 个 异常 没有 在 方法 体内 得 到 处 理 ， 无 论 是 
Java 虚拟 机 内 部 产生 的 异常 ， 还 是 代码 中 使 用 athrow 字 节 码 指令 产生 的 异常 ， 只 要 在 本 方 
法 的 异常 表 中 没有 搜索 到 匹配 的 异常 处 理 器 ， 就 会 导致 方法 退出 ， 这 种 退出 方法 的 方式 称 
为 异常 完成 出 口 (Abrupt Method Invocation Completion)。 

一 个 方法 使 用 异常 完成 出 口 的 方式 退出 ， 是 不 会 给 它 的 上 层 调用 者 产生 任何 返回 值 
的 。 无 论 采 用 何 种 退出 方式 ， 在 方法 退出 之 后 ， 都 需要 返回 到 方法 被 调用 的 位 置 ， 程 序 才 
能 继续 执行 ， 方 法 返回 时 可 能 需要 在 栈 帧 中 保存 一 些 信息 ， 用 来 帮助 恢复 它 的 上 层 方法 的 
执行 状态 。 一 般 来 说 ， 方 法 正常 退出 时 ， 调 用 者 的 PC 计数 器 的 值 就 可 以 作为 返回 地 址 ， 
栈 帧 中 很 可 能 会 保存 这 个 计数 器 值 。 而 方法 异常 退出 时 ， 返 回 地 址 是 要 通过 异常 处 理 器 表 
来 确定 的 ， 栈 帧 中 一 般 不 会 保存 这 部 分 信息 。 

方法 退出 的 过 程 实际 上 等 同 于 把 当前 栈 帧 出 栈 ， 因 此 退出 时 可 能 执行 的 操作 有 : 恢复 
上 层 方法 的 局 部 变量 表 和 操作 数 栈 ， 把 返回 值 (如 果 有 的 话 ) 压 入 调用 者 栈 帧 的 操作 数 栈 
中 ， 调 整 PC 计数 器 的 值 以 指向 方法 调用 指令 后 面 的 一 条 指令 等 。 
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12.2.6 ”附加 信息 


虚拟 机 规范 允许 具体 的 虚拟 机 实现 增加 一 些 规范 里 没有 描述 的 信息 到 栈 帧 之 中 ， 例 如 
与 调试 相关 的 信息 ， 这 部 分 信息 完全 取决 于 具体 的 虚拟 机 实现 ， 这 里 不 再 详 述 。 在 实际 开 
发 中 ， 一 般 会 把 动态 链接 、 方 法 返回 地 址 与 其 他 附加 信息 全 部 归 为 一 类 ， 称 为 栈 帧 信息 。 


12.3 方法 调用 


方法 调用 并 不 等 同 于 方法 执行 ， 方 法 调用 阶段 唯一 的 任务 就 是 确定 被 调用 方法 的 版 
本 ， 即 调用 哪 一 个 方法 ， 暂 时 还 不 涉及 方法 内 部 的 具体 运行 过 程 。 在 程序 运行 时 ， 方 法 调 
用 是 最 普遍 、 最 频繁 的 操作 。 但 是 Class 文件 的 编译 过 程 中 不 包含 传统 编译 中 的 连接 步 
又 ， 一 切 方法 调用 在 Class 文件 里 面 存储 的 都 只 是 符号 引用 ， 而 不 是 方法 在 实际 运行 时 内 
存 布局 中 的 入 口 地 址 。 这 个 特性 给 Java 带 来 了 更 强大 的 动态 扩展 能 力 ， 但 也 使 得 Java 方 
法 的 调用 过 程 变 得 相对 复杂 起 来 ， 需 要 在 类 加 载 期 间 甚 至 到 运行 期 间 才 能 确定 目标 方法 的 
直接 引用 。 在 本 节 的 内 容 中 ， 将 详细 讲解 方法 调用 的 基本 知识 。 


12.3.1 方法 调用 的 背景 


程序 在 有 限 的 资源 下 运行 当然 是 越 快 越 好 ， 这 就 离 不 开 优 化 。 一 般 来 说 都 是 业务 逻辑 
优化 (这 也 是 最 有 效 的 )， 说 到 程序 的 运行 的 优化 就 不 得 不 牵扯 到 JVM 底层 的 字 节 码 了 。 查 
看 字 节 码 的 方法 是 javap -c **.class， 在 此 建议 用 保存 成 文本 文件 方便 用 工具 查看 。 


javap -C **.class > **.txt 


从 class 生成 的 字 节 码 来 看 ，Java 的 方法 调用 分 为 4 种 : invokestatic、invokevirual、 
invokespecial、invokeinterface。 

为 了 说 明 他 们 的 区 别 ， 还 得 说 下 JVM 中 类 的 存储 和 方法 的 早 / 迟 绑 定 。 

1) Class 的 类 方法 的 存放 地 方 和 属性 

JVM 有 一 个 所 有 线程 间 共 享 的 “方法 区 ”， 用 来 存储 每 个 类 结构 的 常数 池 、 域 、 方 法 
数据 、 方 法 和 构造 函数 。 包 括 类 和 实例 初始 化 与 接口 类 型 初始 化 中 用 到 的 特殊 方法 。 所 以 
每 当 有 线程 调用 某 个 类 的 方法 时 ， 都 要 从 方法 区 调用 。Java 类 的 方法 有 很 多 修饰 ， 比 如 
static、final、private 等 ， 这 个 决定 了 jvm 在 底层 调用 方法 上 的 不 同 。 

2) 方法 的 早 / 迟 绑 定 

简单 来 说 ， 要 想 分 辨 一 个 方法 是 早 绑 定 还 是 迟 绑 定 ， 可 以 通过 是 根据 引用 调用 方法 还 
是 通过 对 象 来 调用 方法 来 判断 。 当 一 个 方法 是 static 时 ， 在 任何 地 方 都 可 以 直接 调用 ， 比 
如 Math.abs(4)， 这 个 时 候 就 是 早 绑 定 ， 因 为 这 里 不 需要 用 new 新 建 ， 当 然 没 对 象 了 。 早 绑 
定 不 仅仅 限于 static， 当 调用 private 方法 时 ， 也 是 早 绑 定 ， 因 为 private 只 能 被 自身 类 方法 
调用 。 比 如 下 面 的 Java 代码 : 


Class RAT{ 
private void methodA(){} 


人 
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J B extends RAT{ 

private void methodB(){} 

i a = new classB(); 

此 处 无 法 用 amethodA0 和 amethodB0， 有 了 以 上 说 明 ， 就 可 以 说 清楚 方法 的 具体 区 
别 了 。 

口 invokestatic: 用 于 static 修饰 的 方法 。 任 何 时 候 调 用 只 需要 所 属 的 CLASS 名 , 无 

需 new，JVM 可 以 直接 映射 到 方法 区 ， 是 执行 速度 最 快 的 。 如 果 static 方法 有 参 
数 ， 则 invokestatic 指令 前 还 会 有 个 指令 ， 作 用 是 把 参数 从 栈 弹 出 给 invokestatic 
指令 。( 在 此 没有 详细 讨论 运行 机 制 的 问题 ， 只 是 对 invokevirtual 等 方法 做 了 一 个 
区 分 ) 

口 invokevirtual: 用 于 public 和 protected 修饰 的 ， 且 没有 static 修饰 的 方法 ， 在 
invokevirtual 之 前 ， 总 可 以 见 到 astore 和 aload 的 指令 ， 是 因为 在 调用 
invokevirtual 时 ， 会 从 栈 里 弹出 两 个 参数 一 一 objectref 和 我 们 自 定 义 的 参数 列表 。 
objectref 就 是 this， 因 为 非 static 方法 不 是 直接 从 方法 区 用 的 ， 所 以 得 匹配 所 属 
类 ， 是 默认 的 隐 式 参数 ， 无 法 从 代码 层 指定 objectref。 参 数列 表 就 是 我 们 自 定义 
的 传 入 参数 了 。invokevirtual 是 类 的 方法 调用 最 慢 的 指令 (因为 迟 绑 定 需 要 多 重 校 
验 )， 但 是 却 是 运用 最 多 的 ，Java 面向 对 象 的 多 态 性 离 不 开 它 。 

口 invokespecial: 用 于 3 种 情况 ， 前 2 种 类 默认 的 方法 <init>0 和 super 修饰 的 方法 ， 
它们 可 以 为 隐 式 ，<init>0 是 默认 的 无 参 构造 函数 ，super0 是 默认 的 调用 父 类 构造 
函数 的 函数 。 当 然 我 们 也 可 以 在 代码 层 自 定义 些 参 数 。invokespecial 可 以 默认 从 
构造 函数 里 递归 调用 super0， 而 invokevirtual 不 行 (动态 绑 定 是 只 运行 当前 类 中 的 
方法 ) 之 前 说 过 invokespecial 是 静态 绑 定 的 ， 如 果 换 用 动态 绑 定 是 会 出 错 的 (例如 
构造 函数 的 例子 )， 第 三 种 是 非 static 修饰 的 private 方法 ， 原 因 之 前 也 说 了 。 
invokespecial 的 运行 速度 比较 特殊 ， 在 super 和 init0 时 ， 我 们 可 以 不 用 关心 (关心 
也 无 用 ， 改 不 了 )， 对 于 非 static 的 private 方法 ， 速 度 是 快 于 invokevirtual 的 。 

口 invokeinterface: 用 于 接口 调用 的 情况 ， 速 度 是 最 慢 的 ， 因 为 接口 不 知道 类 的 具体 
信息 ， 所 以 每 次 运行 前 得 遍历 整个 类 ( 校 验 + 匹配 )， 而 invokevirtual 是 直接 关联 类 
的 ， 方 法 偏 移 量 是 固定 的 。 

首先 ，final 是 用 于 不 可 修改 ， 不 可 继承 的 用 途 ， 而 不 是 改变 使 用 或 者 说 调用 的 方法 。 
其 次 ， 对 于 代码 优化 规则 来 说 ，4 种 运行 速度 为 invokestatic > invokespecial > invokevirual > 
invokeinterface， 所 以 总 结 下 常用 方法 是 : 

(1) 根据 具体 的 业务 要 求 ， 分 离 出 常用 的 任务 写成 static 方法 ， 加 快速 度 。 有 人 也 怀疑 
static 方法 会 不 会 占用 更 多 的 内 存 ， 我 认为 不 会 ， 因 为 无 论 是 什么 样 的 方法 都 得 占用 方法 区 
的 空间 ， 调 用 也 是 引用 调用 。 再 说 对 于 现在 上 G 的 内 存 ， 我 们 写 的 几 KK 的 东西 也 算 不 上 
多 大 开销 。 

(2) 遵循 高 内 聚 、 低 耦合 的 模式 ， 一 个 类 只 对 外 提供 必要 的 public 个 protected 方法 ， 
大 部 分 的 内 部 逻辑 就 用 private 修饰 ， 一 来 速度 快 ， 二 来 也 免得 别人 调用 起 来 方法 太 多 看 得 
麻烦 。 
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(3) 对 于 接口 来 说 ， 不 是 用 得 越 多 越 好 ， 抽 象 出 来 的 接口 应 该 越 精简 越 好 ， 笔 者 的 亲 
身体 会 是 接口 多 了 很 麻烦 ， 毕 竟 越 灵活 的 东西 越 难 理解 。 


12.3.2 解析 


继续 前 面 关于 方法 调用 的 话题 ， 所 有 方法 调用 中 的 目标 方法 在 Class 文件 里 面 都 是 一 
个 常量 池 中 的 符号 引用 ， 在 类 加 载 的 解析 阶段 ， 会 将 其 中 的 一 部 分 符号 引用 转化 为 直接 引 
用 ， 这 种 解析 能 成 立 的 前 提 是 : 方法 在 程序 真正 运行 之 前 就 有 一 个 可 确定 的 调用 版 本 ， 并 
且 这 个 版 本 在 运行 期 是 不 可 改变 的 。 换 句 话说， 调用 目标 在 程序 代码 写 好 、 编 译 器 进行 编 
译 时 就 必须 确定 下 来 。 这 类 方法 的 调用 称 为 解析 (Resolution)。 

在 Java 语言 中 ， 符 合 “ 编 译 期 可 知 ， 运 行 期 不 可 变 ”这 个 要 求 的 方法 主要 有 静态 方法 
和 私有 方法 两 大 类 ， 前 者 与 类 型 直接 关联 ， 后 者 在 外 部 不 可 被 访问 ， 这 两 种 方法 都 不 可 能 
通过 继承 或 别 的 方式 重 写 出 其 他 版 本 ， 因 此 它们 都 适合 在 类 加 载 阶段 进行 解析 。 

与 之 相对 应 ， 在 Java 虚拟 机 里 面 提供 了 4 条 方法 调用 字 节 码 指令 : 

口 invokestatic: 调用 静态 方法 。 

口 ”invokespecial: 调用 实例 构造 器 <init> 方 法 、 私 有 方法 和 父 类 方法 。 

口 ”invokevirtual: 调用 所 有 的 虚 方法 。 

口 invokeinterface: 调用 接口 方法 ， 会 在 运行 时 再 确定 一 个 实现 此 接口 的 对 象 。 

只 要 能 被 invokestatic 和 invokespecial 指令 调用 的 方法 ， 都 可 以 在 解析 阶段 确定 唯一 的 
调用 版 本 ， 符 合 这 个 条 件 的 有 静态 方法 、 私 有 方法 、 实 例 构 造 器 方法 和 父 类 方法 四 类 ， 它 
们 在 类 加 载 的 时 候 就 会 把 符号 引用 解析 为 该 方法 的 直接 引用 。 这 些 方 法 可 以 称 为 非 虚 方 
法 ， 与 之 相反 ， 其 他 方法 就 称 为 虚 方 法 (除去 final 方法 ， 后 文 会 提 到 )。 下 面 的 代码 演示 了 
一 个 最 常见 的 解析 调用 的 例子 ， 此 样 例 中 ， 静 态 方 法 sayHello0 只 可 能 属于 类 型 
StaticResolution， 没 有 任何 手段 可 以 覆盖 或 隐藏 这 个 方法 。 


public class StaticResolution { 
public static void sayHello() { 
System. out .println ( " hello world" ) 


} 
public static void main (String[] args) { 
StaticResolution. sayHello ( ) ; 
} 


使 用 javap 命令 可 以 查看 上 述 代码 的 字 节 码 ， 查 看 后 会 发 现 是 通过 invokestatic 命令 来 
调用 sayHello() 方 法 的 。 


D:\Develop\>javap -verbose StaticResolution 
public static void main (java.lang.string [] ) ; 


Code : 

Stack=0，Locals=1，Rrgs size=1 

0: invokestatic #31; //Method sayHello: ()V 
K return 
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LineNumberTable : 
line 15:0 
line 16 : 3 


Java 中 的 非 虚 方法 除了 使 用 invokestatic 和 invokespecial 调用 的 方法 之 外 还 有 一 种 ， 就 
是 被 final 修饰 的 方法 。 虽然 final 方法 是 使 用 invokevirtual 指令 来 调用 的 ， 但 是 由 于 它 无 
法 被 覆盖 ， 没 有 其 他 版 本 ， 所 以 也 无 需 对 方法 接收 者 进行 多 态 选 择 ， 又 或 者 说 多 态 选 择 的 
结果 肯定 是 唯一 的 。 在 Java 语言 规范 中 明确 说 明了 final 方法 是 一 种 非 虚 方 法 。 

解析 调用 一 定 是 个 静态 的 过 程 ， 在 编译 期 间 就 完全 确定 ， 在 类 装载 的 解析 阶段 就 会 把 
涉及 的 符号 引用 全 部 转变 为 可 确定 的 直接 引用 ， 不 会 延迟 到 运行 期 再 去 完成 。 而 分 派 
(Dispatch) 调 用 则 可 能 是 静态 的 也 可 能 是 动态 的 ， 根 据 分 派 依据 的 宗 量 数 可 分 为 单 分 派 和 多 
分 派 。 这 两 类 分 派 方式 两 两 组 合 就 构成 了 静态 单 分 派 、 静 态 多 分 派 、 动 态 单 分 派 、 动 态 多 
分 派 四 种 分 派 情况 ， 下 面 我 们 看 看 虚拟 机 中 的 方法 分 派 是 如 何 进行 的 。 


12.3.3 ”分派 


众所周知 ，Java 是 一 门面 向 对 象 的 程序 设计 语言 ， 因 为 Java 具备 面向 对 象 的 三 个 基本 
特征 : 继承 、 封 装 和 多 态 。 本 节 讲 解 的 分 派 调 用 过 程 将 会 揭示 多 态 性 特征 的 一 些 最 基本 的 
体现 (如 “ 重 载 ” 和 “ 重 写 ”)， 在 Java 中 是 如 何 实现 的 ， 这 里 的 实现 当然 不 是 语法 上 该 如 
何 写 ， 我 们 关心 的 依然 是 虚拟 机 如 何 确定 正确 的 目标 方法 。 


1. 静态 分 派 


在 开始 讲解 静态 分 派 前 ， 笔 者 准备 了 一 段 经 常 出 现在 面试 题 中 的 程序 代码 ， 读 者 不 妨 
先 看 一 遍 ， 想 一 下 程序 的 输出 结果 是 什么 。 后 面 我 们 的 话题 将 围绕 这 个 类 的 方法 来 重 载 
(Overload) 代 码 ， 以 分 析 虚 拟 机 和 编译 器 确定 方法 版 本 的 过 程 。 演 示 代 码 如 下 。 


package org.zzz.polymorphic; 
public class StaticDispatch { 
static abstract class Human { 
} 
static class Man extends Human { 
3 
static class Women extends Human { 
public void sayHello (Human guy) { 
System.out.println ( " hello, guy ! " ); 
了 
public void sayHello (Man guy) { 
System.out .println ( " hello, gentlemanl ,, ); 
} 
public void sayHello (Women guy) { 
System.out.println ( "hello,lady ! " ); 
} 
public static void main(String[J args) { 
Human man = new Man(); 
Human women = new Women() ; 
StaticDispatch sd = new StaticDispatch() ; 
sr.sayHello (man) ; 
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sr.sayHello (women) ; 
3 
BE 
运行 结果 : 
hello, guy! 
hello, guy! 
上 述 演示 代码 实际 上 是 在 考察 阅读 者 对 重 载 的 理解 程度 ， 相 信 对 Java 稍 有 经 验 的 程序 
员 看 完 程序 后 都 能 得 出 正确 的 运行 结果 ， 但 为 什么 会 选择 执行 参数 类 型 为 Human 的 重 载 
呢 ? 在 解决 这 个 问题 之 前 ， 我 们 先 使 用 如 下 代码 定义 两 个 重要 的 概念 : 


Human man=new Man(); 


我 们 把 上 面 代码 中 的 “Human ” 称 为 变量 的 静态 类 型 (Static Type) 或 者 外 观 类 型 
(Apparent Type)， 后 面 的 “Man” 则 称 为 变量 的 实际 类 型 (Actual Type)， 静 态 类 型 和 实际 类 
型 在 程序 中 都 可 以 发 生 一 些 变化 ， 区 别 是 静态 类 型 的 变化 仅仅 在 使 用 时 发 生 ， 变 量 本 身 的 
静态 类 型 不 会 被 改变 ， 并 且 最 终 的 静态 类 型 是 在 编译 期 可 知 的 ， 而 实际 类 型 变化 的 结果 在 
运行 期 才 可 确定 ， 编 译 器 在 编译 程序 的 时 候 并 不 知道 一 个 对 象 的 实际 类 型 是 什么 。 如 下 面 
的 代码 : 

// 实 际 类 型 变化 

Human man=new Man(); 
man=new Women (); 

// 静 态 类 型 变化 

sr.sayHello( (Man) man) 
sr.sayHello( (Women) man) 

再 次 回 到 上 述 演示 代码 中 。 在 方法 main0 中 进行 了 两 次 调用 sayHello0 方 法 的 过 程 ， 在 
方法 接收 者 已 经 确定 是 对 象 “sr” 的 前 提 下 ， 使 用 哪个 重 载 版 本 ， 就 完全 取决 于 传 入 参数 
的 数量 和 数据 类 型 。 代 码 中 刻意 地 定义 了 两 个 静态 类 型 相同 、 实 际 类 型 不 同 的 变量 ， 但 虚 
拟 机 (准确 地 说 是 编译 器 ) 在 重 载 时 是 通过 参数 的 静态 类 型 而 不 是 实际 类 型 作为 判定 依据 
的 。 并 且 静 态 类 型 是 编译 期 可 知 的 ， 所 以 在 编译 阶段 ，Javac 编译 器 就 根据 参数 的 静态 类 
型 决定 使 用 哪个 重 载 版 本 ， 所 以 选择 了 sayHello(Human) 作 为 调用 目标 ， 并 把 这 个 方法 的 符 
号 引用 写 到 main() 方 法 里 的 两 条 invokevirtual 指令 的 参数 中 。 

所 有 依赖 静态 类 型 来 定位 方法 执行 版 本 的 分 派 动作 ， 都 称 为 静态 分 派 。 静 态 分 派 的 最 
典型 应 用 就 是 方法 重 载 。 静 态 分 派发 生 在 编译 阶段 ， 因 此 确定 静态 分 派 的 动作 实际 上 不 是 
由 虚拟 机 来 执行 的 。 另 外 ， 编 译 器 虽然 能 确定 出 方法 的 重 载 版 本 ， 但 在 很 多 情况 下 这 个 重 
载 版 本 并 不 是 “唯一 的 ”， 往 往 只 能 确定 一 个 “更 加 合适 的 ”版 本 。 这 种 模糊 的 结论 在 由 
0 和 1 构成 的 计算 机 世界 中 算是 个 比较 “稀罕 ”的 事件 ， 产 生 这 种 模糊 结论 的 主要 原因 是 
字面 量 不 需要 定义 ， 所 以 字面 量 没 有 显 式 的 静态 类 型 ， 它 的 静态 类 型 只 能 通过 语言 上 的 规 
则 去 理解 和 推断 。 例 如 下 面 的 代码 演示 了 何 为 “更 加 合适 的 ”版 本 。 

package org.zzz.polymorphic; 
public class Overload 


public static void sayHello(Object arg) { 
System.out .println ( "hello Object " ) ; 


KE. 
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public static void sayHello(int arg) { 
System.out.println ( "hello int " ); 
3 
public static void sayHello(long arg) { 
system. out .println ( " hello long ") 
} 
public static void sayHello(Character arg) { 
System.out .println ( "hello Character" ) ; 
} 
public static void sayHello(char arg) { 
System. out -println ( " hello char" ) 
} 
public static void sayHello(char... arg) { 
System.out .println ( "hello char ." ) ; 
} 
public static void sayHello(Serializable arg) { 
System. out .println ( " hello Serializable " ) 
} 
public static void main(string[] args) { 
sayHello ( 'a'); 
b 


运行 后 会 输出 : 
hello char 
由 此 可 见 ，'a' 是 一 个 char 类 型 的 数据 ， 自 然 会 寻找 参数 类 型 为 char 的 重 载 方法 ， 如 
果 注 释 掉 sayHello(char arg) 方 法 ， 那 么 输出 会 变 为 
hello int 
这 时 发 生 了 一 次 自动 类 型 转换 ，'a' 除 了 可 以 代表 一 个 字符 串 外 ， 还 可 以 代表 数字 
65( 字 符 'a' 的 Unicode 数值 为 十 进 制 数字 65)， 因 此 参数 类 型 为 int 的 重 载 也 是 合适 的 。 我 
们 继续 注释 掉 sayHello(int arg) 方 法 ， 那 么 输出 会 变 为 : 


hello long 


这 时 发 生 了 两 次 自动 类 型 转换 ，'a' 转 换 为 整数 65 之 后 ， 进 一 步 转换 为 长 整数 65L， 
匹配 了 参数 类 型 为 long 的 重 载 。 笔 者 在 代码 中 没有 编写 其 他 类 型 (如 float、double 等 ) 的 重 
载 ， 不 过 实际 上 自动 转型 还 能 继续 发 生 多 次 ， 按 照 char 一 int 一 long 一 float 一 double 的 顺序 
转型 进行 匹配 。 但 不 会 匹配 到 byte 和 short 类 型 的 重 载 ， 因 为 char 到 byte 或 short 的 转型 
是 不 安全 的 。 我 们 继续 注释 掉 sayHello(long arg) 方 法 ， 那 么 输出 会 变 为 : 


hello Character 


这 时 发 生 了 一 次 自动 装 箱 ，'a' 被 包装 为 它 的 封装 类 型 java.lang.Character， 所 以 匹配 
到 了 参数 类 型 为 Character 的 重 载 ， 继 续 注释 掉 sayHello(Character arg) 方 法 ， 那 么 输出 会 
变 为 : 


hello Serializable 
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这 个 输出 可 能 会 让 人 摸 不 着 头脑 ， 一 个 字符 或 数字 与 序列 化 有 什么 关系 ? 出现 hello 
Serializable， 是 因为 java.lang.Serializable 是 java.lang.Character 类 实现 的 一 个 接口 ， 自 动 装 
箱 之 后 发 现 还 是 找 不 到 装 箱 类 ,但 是 找到 了 装 箱 类 实现 了 的 接口 类 型 ， 所 以 紧 接 着 又 发 生 
一 次 自动 转型 。char 可 以 转型 成 int， 但 是 Character 是 绝对 不 会 转型 为 Integer 的 ， 它 只 能 
安全 地 转型 为 它 实现 的 接口 或 父 类 。Character 还 实现 了 另外 一 个 接口 javalang. 
Comparable<Character> ， 如 果 同 时 出 现 两 个 参数 分 别 为 Serializable 和 Comparable 
<Character> 的 重 载 方法 ， 那 么 它们 此 时 的 优先 级 是 一 样 的。 编译 器 无 法 确定 要 自动 转型 为 
哪 种 类 型 ， 会 提示 类 型 模糊 ， 拒 绝 编译 。 程 序 必须 在 调用 时 显 式 地 指定 字面 量 的 静态 类 
型 ， 如 sayHello((Comparable<Character>)'a'") ， 才 能 通过 编译 。 下 面 继续 注释 掉 
sayHello(Serializable arg) 方 法 ， 输 出 会 变 为 : 

hello Object 


这 时 是 char 装 箱 后 转型 为 父 类 了 ， 如 果 有 多 个 父 类 ， 那 么 将 在 继承 关系 中 从 下 往 上 开 
始 搜 索 ， 越 接近 上 层 的 优先 级 越 低 。 即 使 方法 调用 传人 的 参数 值 为 null， 这 个 规则 仍然 适 
用 。 我 们 把 sayHello(Object arg) 也 注释 掉 ， 输 出 将 会 变 为 : 


hello char... 


7 个 重 载 方法 已 经 被 注释 得 只 剩 一 个 了 ， 可 见 变 长 参数 的 重 载 优 先 级 是 最 低 的 ， 这 时 
候 字符 'a' 被 当 作 了 一 个 数组 元 素 。 笔 者 使 用 的 是 char 类 型 的 变 长 参数 ， 读 者 在 验证 时 还 
可 以 选择 int 类 型 、Character 类 型 、Object 类 型 等 的 变 长 参数 重 载 来 把 上 面 的 过 程 重新 演 
示 一 遍 。 但 是 要 注意 的 是 ， 有 一 些 在 单个 参数 中 能 成 立 的 自动 转型 ， 如 char 转型 为 int， 
在 变 长 参数 中 是 不 成 立 的 。 


2. 动态 分 派 


了 解 了 静态 分 派 ， 我 们 接 下 来 看 一 下 动态 分 派 的 过 程 ， 它 和 多 态 性 的 另外 一 个 重要 体 
现 一 一 重 写 (Override) 有 着 很 密切 的 关联 。 我 们 还 是 用 前 面 的 Man 和 Women 一 起 ， 
sayHello 的 例子 来 讲解 动态 分 派 ， 请 看 下 面 的 演示 代码 。 


public class DynamicDispatch { 
static abstract class Human { 
protected abstract void sayHello() ; 
} 
static class Man extends Human { 
@Override 
protected void sayHello() { 
System.out.println ( "man say hello") ; 
| 
} 
static class Women extends Human { 
@Override 
protected void sayHello() { 
System.out.println ( "women say hello") ; 
} 
} 
public static void main(string[J args) { 
Human man = new Man(); 
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Human women = new Women() ; 
man. sayHello ( ); 
women. sayHello () :> 

- man = new Women(); 
man. sayHello ( ) ， 
} 


运行 结果 : 
man say hello 


women say hello 
women say hello 


这 个 运行 结果 相信 不 会 出 乎 任何 人 的 意料 ， 习 惯 了 面向 对 象 思维 的 Java 程序 员 会 觉得 
这 是 完全 理所当然 。 我 们 现在 的 问题 还 是 和 前 面 的 一 样 ， 虚 拟 机 是 如 何 知道 要 调用 哪个 方 
法 的 ? 

显然 这 里 是 不 可 能 根据 静态 类 型 来 决定 的 ， 因 为 静态 类 型 都 是 Human 的 两 个 变量 man 
和 women 在 调用 sayHello() 方 法 时 执行 了 不 同 的 行为 ， 并 且 变 量 man 在 两 次 调用 中 执行 了 
不 同 的 方法 。 导 致 这 个 现象 的 原因 很 明显 ， 是 这 两 个 变量 的 实际 类 型 不 同 ，Java 虚拟 机 是 
如 何 根据 实际 类 型 来 分 派 方法 执行 版 本 的 呢 ? 我 们 使 用 javap 命令 输出 这 段 代 码 的 字 节 
码 ， 结 果 如 下 面 的 演示 代码 : 


public static void main (java.lang.string [] ) ; 
Code : 
Stack=2, Locals=3, Args size=1 
0: new #16; //class 
org/zzz/p olymorphic/DynamicDispatch$Man 
后 - dup 
4: invokespecial #18; //Method 
org/zzz/polymorphic/DynamicDispatch$Man. " <init >": ()YV 
和 astore 1 
8: new #19; //class 
org/zzz/polymorphic/DynamicDispatch$Women 


人 dup 
12: invokespecial #21; //Method 
org/zzz/polymorphic/DynamicDispatch$Women. " <init >": ()YV 


Ls astore 2 
16: aload 1 
17: invokevirtual #22; //Method 
org/f enixsoft/polymorphic/DynamicDispatch$Human . sayHello : ( ) v 
20: aload 2 
21: invokevirtual #22; //Method 
org/zzz/polymorphic/DynamicDispatch$Human . sayHello : ()y 
24: new #19; //class 
org/f enixs o f t /polymorphic/DynamicDispat ch$Women 


D7 dup 
28: invokespecial #21; //Method 
org/zzz/polymorphic/DynamicDispatch$Women. ri<init >" : () v 
3 Tastore 1 
32: aload 1 
33: invokevirtual #22. //Method 
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org/zzz/polymorphic/DynamicDispat ch$Human. sayHello : ( ) V 
| return 
在 上 述 代码 中 ，0 一 15 行 的 字 节 码 是 准备 动作 ， 作 用 是 建立 man 和 women 的 内 存 空 
间 、 调 用 Man 和 Women 类 型 的 实例 构造 器 ， 将 这 两 个 实例 的 引用 存放 在 第 1 和 第 2 个 局 
部 变量 表 Slot 之 中 ， 这 个 动作 对 应 了 代码 中 的 这 两 句 : 


Human man=new Man(); 
Human women=new Women () 7 


接 下 来 的 第 16 一 21 行 是 关键 部 分 ， 第 16 和 第 20 两 行 分 别 把 刚刚 创建 的 两 个 对 象 的 
引用 压 到 栈 顶 ， 这 两 个 对 象 是 将 要 执行 的 sayHello0 方 法 的 所 有 者 ， 称 为 接收 者 
(Receiver): 第 17 和 第 21 两 行 是 方法 调用 指令 ， 单 从 字 节 码 的 角度 来 看 ， 这 两 条 调用 指令 
无 论 是 指令 (都 是 invokevirtual) 还 是 参数 (都 是 常量 池 中 第 22 项 的 常量 ， 注 释 显示 了 这 个 常 
量 是 Human.sayHello() 的 符号 引用 ) 都 完全 一 样 ， 但 是 这 两 条 指令 最 终 执行 的 目标 方法 并 不 
相同 ， 其 原因 需要 从 invokevirtual 指令 的 多 态 查找 过 程 开 始 说 起 ，invokevirtual 指令 的 运行 
时 解析 过 程 大 致 分 为 以 下 几 步 : 

(1) 找到 操作 数 栈 顶 的 第 一 个 元 素 所 指向 的 对 象 的 实际 类 型 ， 记 作 C。 

(2) 如 果 在 类 型 C 中 找到 与 常量 中 的 描述 符 和 简单 名 称 都 相符 的 方法 ， 则 进行 访问 权 
限 校 验 ， 如 果 通 过 则 返回 这 个 方法 的 直接 引用 ， 查 找 过 程 结束 ; 不 通过 则 返回 java.lang. 
IllegalAccessError 异常 。 

(3) 否则 ， 按 照 继承 关系 从 下 往 上 依次 对 C 的 各 个 父 类 进行 第 2 步 的 搜索 和 验证 

(4) 如 果 始 终 没 有 找到 合适 的 方法 ， 则 抛 出 java.lang.AbstractMethodError 异常 。 

由 于 invokevirtual 指令 执行 的 第 一 步 就 是 在 运行 期 确定 接收 者 的 实际 类 型 ， 所 以 两 次 
调用 中 的 invokevirtual 指令 把 常量 池 中 的 类 方法 符号 引用 解析 到 了 不 同 的 直接 引用 上 ， 这 
个 过 程 就 是 Java 语言 中 方法 重 写 的 本 质 。 我 们 把 这 种 在 运行 期 根据 实际 类 型 确定 方法 执行 
版 本 的 分 派 过 程 称 为 动态 分 派 。 


3. 单 分 派 与 多 分 派 


方法 的 接收 者 与 方法 的 参数 统称 为 方法 的 宗 量 ， 这 个 定义 最 早 应 该 来 源 于 《Java 与 模 
式 》 一 书 的 译文 。 根 据 分 派 基 于 多 少 种 宗 量 ， 可 以 将 分 派 划分 为 单 分 派 和 多 分 派 两 种 。 单 
分 派 是 根据 一 个 宗 量 对 目标 方法 进行 选择 ， 多 分 派 则 是 根据 多 于 一 个 的 宗 量 对 目标 方法 进 
行 选 择 。 
单 分 派 和 多 分 派 的 定义 相当 擂 口 ， 不 过 对 照 着 实例 看 就 不 难 理解 了 ， 在 下 面 的 演示 代 
码 中 列举 了 一 个 Baba 和 Erzi 一 起 来 做 出 决定 的 例子 。 
public class Dispatch { 
staticl class nd 和 
statiec class 360 €} 
public static class Baba { 
public void hardchoice (QQ arg) { 
System.-out .println ( " baba choose qq") ; 


} 
public void hardCchoice( 360 arg) { 
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System.out.println ( " baba choose 360 "); 
} 
} 
public static class Erzi ex.tends Baba { 
public void hardChoice (QQ arg) { 
System.out.println ( "erzi choose qq") ; 
} 
public void hardChoice( 360 arg) { 
System.out.println ( "erzi choose 360 ") : 
} 
} 
public static void main(String[1 args) { 
Baba baba = new Baba() ; 
Baba sori = new Erzi(); 
baba.hardChoice (new S60 
erzi.hardChoice (new QQ () ); 


下 

运行 结果 : 
baba choose 360 
erzi choose qq 

在 mam 函数 中 调用 了 两 次 hardChoice() 方 法 ， 这 两 次 hardChoice() 方 法 的 选择 结果 在 
程序 输出 中 已 经 显示 得 很 清楚 了 。 

再 来 看 看 编译 阶段 编译 器 的 选择 过 程 ， 即 静态 分 派 的 过 程 。 这 时 候选 择 目标 方法 的 依 
据 有 两 点 : 一 是 静态 类 型 是 Baba 还 是 Erzi， 二 是 方法 参数 是 QQ 还 是 360。 这 次 选择 结果 
的 最 终 产 物 是 产生 了 两 条 invokevirtual 指令 ， 两 条 指令 的 参数 分 别 为 常量 池 中 指向 
Baba.hardChoice(360) 及 Baba.hardChoice(QQ) 方 法 的 符号 引用 。 因 为 是 根据 两 个 宗 量 进行 选 
择 ， 所 以 Java 语言 的 静态 分 派 属 于 多 分 派 类 型 。 

再 看 看 运行 阶段 虚拟 机 的 选择 ， 即 动态 分 派 的 过 程 。 在 执行 “erzi.hardChoice(new 
QQ0)” 这 句 代码 时 ， 更 准确 地 说 ， 在 执行 这 句 代码 所 对 应 的 invokevirtual 指令 时 ， 由 于 编 
译 期 已 经 决定 目标 方法 的 签名 必须 为 hardChoice(QQ)， 虚 拟 机 此 时 不 会 关心 传递 过 来 的 参 
数 “QQ” 到 底 是 “腾讯 QQ” 还 是 “奇瑞 QQ”， 因 为 这 时 候 参数 的 静态 类 型 、 实 际 类 型 
都 不 会 对 方法 的 选择 构成 任何 影响 ， 唯 一 可 以 影响 虚拟 机 选择 的 因素 只 有 此 方法 的 接收 者 
的 实际 类 型 是 Baba 还 是 Erzi。 因 为 只 有 一 个 宗 量 作为 选择 依据 ， 所 以 Java 语言 的 动态 分 
派 属 于 单 分 派 类 型 。 

根据 上 述 论证 的 结果 可 以 看 出 ， 当 前 的 Java 语言 是 一 门 静 态 多 分 派 、 动 态 单 分 派 的 语 
言 。 强 调 “ 当 前 的 Java 语言 ”是 因为 这 个 结论 未 必 会 恒久 不 变 ，C# 在 3.0 及 之 前 的 版 本 与 
Java 一 样 是 动态 单 分 派 语言 。 但 是 在 C# 4.0 中 引入 了 dynamic 类 型 后 ， 就 可 以 很 方便 地 实 
现 动 态 多 分 派 。Java 也 已 经 在 JSR-292 中 开始 规划 对 动态 语言 的 支持 了 ， 日 后 将 有 可 能 提 
供 类 似 的 动态 类 型 功能 。 


4. 虚拟 机 动态 分 派 的 实现 
前 面 介 绍 的 分 派 过 程 ， 作 为 对 虚拟 机 概念 模型 的 解析 基本 上 已 经 足够 了 ， 它 已 经 解决 
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odor, 


了 虚拟 机 在 分 派 中 “会 做 什么 ”这 个 问题 。 但 是 虚拟 机 “具体 是 如 何 做 到 的 ”， 可 能 各 种 
虚拟 机 的 实现 都 会 有 所 差别 。 

由 于 动态 分 派 是 非常 频繁 的 动作 ， 而 且 动 态 分 派 的 方法 版 本 选择 过 程 需要 运行 时 在 类 
的 方法 元 数据 中 搜索 合适 的 目标 方法 ， 因 此 在 虚拟 机 的 实际 实现 中 基于 性 能 的 考虑 ， 大 部 
分 实现 都 不 会 真 的 进行 如 此 频繁 的 搜索 。 面 对 这 种 情况 ， 最 常用 的 “稳定 优化 ”手段 就 是 
为 类 在 方法 区 中 建立 一 个 虚 方法 表 (Virtual Method Table， 也 称 为 vtable， 与 此 对 应 ， 在 
invokeinterface 执行 时 也 会 用 到 接口 方法 表 -Interface Method Table， 简 称 itable)， 使 用 虚 方 
法 表 索 引 来 代替 元 数据 查找 以 提高 性 能 。 我 们 先 看 看 代码 清单 8-10 所 示 。 

虚 方 法 表 中 存放 着 各 个 方法 的 实际 入 口 地 址 。 如 果 某 个 方法 在 子 类 中 没有 被 重 写 ， 那 
么 子 类 的 虚 方法 表 里 面 的 地 址 入 口 和 父 类 相同 方法 的 地 址 入 口 是 一 致 的 ， 都 指向 父 类 的 实 
现 入 口 。 如 果子 类 中 重 写 了 这 个 方法 ， 予 类 方法 表 中 的 地 址 将 会 被 替换 为 指向 子 类 实现 版 
本 的 入 口 地 址 。 

为 了 程序 实现 上 的 方便 ， 具 有 相同 签名 的 方法 ， 在 父 类 、 子 类 的 虚 方法 表 中 都 应 当 具 
有 一 样 的 索引 序号 ， 这 样 当 类 型 变换 时 ， 仅 需要 变更 查找 的 方法 表 ， 就 可 以 从 不 同 的 虚 方 
法 表 中 按 索引 转换 出 所 需 的 入 口 地 址 。 

方法 表 一 般 在 类 加 载 的 连接 阶段 进行 初始 化 ， 准 备 了 类 的 变量 初始 值 后 ， 虚 拟 机 会 把 
该 类 的 方法 表 也 初始 化 完毕 。 

上 文中 笔者 说 方法 表 是 分 派 调用 的 “稳定 优化 ”和 手段， 虚拟 机 除了 使 用 方法 表 之 外 ， 
在 条 件 允 许 的 情况 下 ， 还 会 使 用 内 联 缓存 (Inline Cache) 和 基于 “类 型 继承 关系 分 析 ”(Class 
Hierarchy Analysis，CHA) 技 术 的 守护 内 联 (Guarded Inlining) 两 种 非 稳 定 的 “激进 优化 ” 手 
段 来 获得 更 高 的 性 能 ， 关 于 这 两 种 优化 技术 的 原理 和 运作 过 程 ， 读 者 可 以 参考 本 书 第 11 
章 中 的 相关 内 容 。 


12.4 ”基于 栈 的 字 节 码 解 释 执行 引擎 


关于 虚拟 机 是 如 何 调用 方法 已 经 讲解 完毕 ， 从 本 节 开 始 ， 我 们 来 探讨 虚拟 机 是 如 何 执 
行 方法 里 面 的 字 节 码 指令 的 。 概 述 中 提 到 过 ， 许 多 Java 虚拟 机 的 执行 引擎 在 执行 Java 代 
码 的 时 候 都 有 解释 执行 (通过 解释 器 执行 ) 和 编译 执行 (通过 即时 编译 器 产生 本 地 代码 执行 ) 两 
种 选择 ， 下 面 我 们 先 来 探讨 一 下 在 解释 执行 时 虚拟 机 执行 引擎 是 如 何 工 作 的 。 


12.4.1 解释 执行 


Java 语言 经 常 被 人 们 定位 为 “解释 执行 ”的 语言 ， 在 Java 初生 的 JDK 1.0 时 代 ， 这 种 
定义 还 算是 比较 准确 的 ， 但 当主 流 的 虚拟 机 中 都 包含 了 即时 编译 器 后 ，Class 文件 中 的 代码 
到 底 会 被 解释 执行 还 是 编译 执行 ， 就 成 了 只 有 虚拟 机 自己 才能 准确 判断 的 事 。 再 后 来 ， 
Java 发 展 出 了 可 以 直接 生成 本 地 代码 的 编译 器 (如 GNU Compiler for the Java，GCJ)， 而 
C/C++ 语言 也 出 现 了 通过 解释 器 执行 的 版 本 (如 CINT)， 这 时 候 再 笼统 地 说 “解释 执行 ”对 
于 整个 Java 语言 来 说 几乎 就 是 没有 意义 的 概念 了 ， 只 有 确定 了 谈论 对 象 是 某 种 具体 的 Java 
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实现 版 本 和 执行 引擎 运行 模式 时 ， 谈 解释 执行 还 是 编译 执行 才 会 比较 确切 。 

不 论 是 解释 还 是 编译 ， 也 不 论 是 物理 机 还 是 虚拟 机 ， 对 于 应 用 程序 ， 机 器 都 不 可 能 如 
人 那样 阅读 和 理解 ， 然 后 就 获得 了 执行 能 力 。 大 部 分 的 程序 代码 到 物理 机 的 目标 代码 或 虚 
拟 机 能 执行 的 指令 集 之 前 ， 都 需要 经 过 下 面 的 各 个 步骤 。 

(1) 程序 源码 。 

(2) 分 析 词 法 。 

(3) 单词 流 。 

(4) 分 析 语法 。 

(5) 抽象 语法 树 : 此 过 程 有 两 个 分 支 。 

第 一 个 分 支 如 下 : 

口 ”指令 流 (可 选 的 )。 

口 ”解释 器 。 

口 ”解释 执行 。 

第 二 个 分 支 如 下 : 

口 “ 中 间 代 码 (可 选 的 )。 

口 “ 生 成 器 。 

口 目标 代码 。 

如 今 ， 基 于 物理 机 、Java 虚拟 机 或 者 是 非 Java 的 其 他 高 级 语言 虚拟 机 (HLLVM) 的 语 
言 ， 大 多 都 遵循 这 种 基于 现代 经 典 编 译 原 理 的 思路 ， 在 执行 前 先 对 程序 源码 进行 词法 分 析 
和 语法 分 析 处 理 ， 把 源码 转化 为 抽象 语法 树 (Abstract Syntax Tree，AST)。 对 于 一 门 具体 语 
言 的 实现 来 说 ， 词 法 和 语法 分 析 乃 至 后 面 的 优化 器 和 目标 代码 生成 器 都 可 以 选择 独立 于 执 
行 引擎 ， 形 成 一 个 完整 意义 的 编译 器 去 实现 ， 这 类 代表 是 C/C++ 语言 。 也 可 以 选择 把 其 中 
一 部 分 步骤 (如 生成 抽象 语法 树 之 前 的 步 又) 实现 为 一 个 半 独 立 的 编译 器 ， 这 类 代表 是 Java 
语言 。 又 或 者 把 这 些 步 又 和 执行 引擎 全 部 集中 封装 在 一 个 封闭 的 黑匣子 之 中 ， 如 大 多 数 的 
JavaScript 执行 器 。 

Java 语言 中 ，Javac 编译 器 完成 了 程序 代码 经 过 词法 分 析 、 语 法 分 析 到 抽象 语法 树 ， 
再 遍历 语法 树 生 成 线性 的 字 节 码 指 令 流 的 过 程 。 因 为 这 一 部 分 动作 是 在 Java 虚拟 机 之 外 进 
行 的， 而 解释 器 在 虚拟 机 的 内 部 ， 所 以 Java 程序 的 编译 就 是 半 独 立 的 实现 。 


12.4.2 ”基于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 


Java 编译 器 输出 的 指令 流 ， 基 本 上 是 一 种 基于 栈 的 指令 集 架 构 (Instruction Set 
Architecture，ISA)， 指 令 流 里 面 的 指令 大 部 分 都 是 零 地 址 指令 ， 它 们 依赖 操作 数 栈 进行 工 
作 。 与 之 相对 的 另外 一 套 常 用 的 指令 集 架构 是 基于 寄存 器 的 指令 集 ， 最 典型 的 就 是 x86 的 
二 地 址 指令 集 ， 更 通俗 一 些 ， 就 是 现在 我 们 主流 PC 中 直接 支持 的 指令 集 架构 ， 这 些 指令 
依赖 寄存 器 进行 工作 。 那 么 ， 基 于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 这 两 者 之 间 有 什么 不 
同 呢 ? 

举 个 最 简单 的 例子 ， 分 别 使 用 这 两 种 指令 集 去 计算 “1+1” 的 结果 ， 基 于 栈 的 指令 集 
会 是 这 样子 的 : 


PD PR RT OO ON p> 
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Iconst 1 
iconst 1 
iadd 
istore 0 
两 条 iconst_1 指令 连续 地 把 两 个 常量 1 压 入 栈 后 ，iadd 指令 把 栈 项 的 两 个 值 出 栈 并 相 
加 ， 然 后 把 结果 放 回 栈 顶 ， 最 后 istore_0 把 栈 顶 的 值 放 到 局 部 变量 表 的 第 0 个 Slot 中 。 
如 果 是 基于 寄存 器 的 指令 集 ， 那 么 程序 可 能 会 是 这 个 样子 的 : 


mov eax,l 
+add eax, 1 


mov 指令 把 EAX 寄存 器 的 值 设 为 1， 然 后 add 指令 再 把 这 个 值 加 1， 结 果 就 保存 在 
EAX 寄存 器 里 面 。 

了 解 了 基于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 的 区 别 后 ， 读 者 可 能 会 有 进一步 的 疑 
问 ， 这 两 套 指令 集 谁 更 好 一 些 呢 ? 应 该 说 ， 既 然 两 套 指令 集 同时 并 存 和 发 展 ， 那 么 肯定 是 
各 有 优势 的 ， 如 果 有 一 套 指令 集 全 面 优 于 另外 一 套 的 话 ， 就 不 存在 选择 的 问题 。 

基于 栈 的 指令 集 最 主要 的 优点 就 是 可 移植 性 ， 寄 存 器 由 硬件 直接 提供 ， 程 序 直接 依赖 
这 些 硬 件 寄存 器 则 不 可 避免 地 要 受到 硬件 的 约束 。 例 如 ， 现 在 32 位 x86 体系 的 处 理 器 中 
提供 了 8 个 32 位 的 寄存 器 ， 而 ARM 体系 的 CPU( 在 当前 的 手机 、PDA 中 相当 流行 的 一 种 
处 理 器 ) 则 提供 了 16 个 32 位 的 通用 寄存 器 。 如 果 使 用 栈 架 构 的 指令 集 ， 用 户 程序 不 会 直接 
用 到 这 些 寄存 器 ， 那 就 可 以 由 虚拟 机 实现 来 自行 决定 把 一 些 访问 最 频繁 的 数据 (程序 计数 
器 、 栈 顶 缓存 等 ) 放 到 寄存 器 中 以 获取 尽量 好 的 性 能 ， 这 样 实现 起 来 也 更 加 简单 。 栈 架构 的 
指令 集 还 有 一 些 其 他 优点 ， 如 代码 相对 更 紧凑 ( 字 节 码 中 每 个 字 节 就 对 应 一 条 指令 ， 而 多 地 
址 指令 集中 还 需要 存放 参数 )、 编 译 器 实现 更 加 简单 (不 需要 考虑 空间 分 配 的 问题 ， 所 需 空 
间 都 在 栈 上 操作 ) 等 。 

栈 架构 指令 集 的 主要 缺点 是 执行 速度 相对 来 说 稍 慢 一 些 。 栈 架构 指令 集 的 代码 虽然 紧 
凑 ， 但 是 完成 相同 功能 所 需 的 指令 数量 一 般 会 比 存 器 架构 多 ， 因 为 出 栈 、 入 栈 操作 本 身 就 
产生 了 相当 多 的 指令 。 更 重要 的 是 栈 实 在 内 存 之 中 ， 频 繁 的 栈 访问 也 就 意味 着 频繁 的 内 存 
访问 ， 相 对 于 处 理 器 来 说 ， 内 始终 是 执行 速度 的 瓶颈 。 尽 管 虚拟 机 可 以 采取 栈 顶 缓存 的 手 
段 ， 把 最 常用 的 操作 射 到 寄存 器 中 以 避免 直接 内 存 访问 ， 但 这 也 只 能 是 优化 措施 而 不 是 解 
决 本 质问 题 方法 。 因 此 ， 由 于 指令 数量 和 内 存 访 问 的 原因 ， 导 致 了 栈 架构 指令 集 的 执行 速 
度 相对 较 慢 。 


12.4.3 ”基于 栈 的 解释 器 执行 过 程 


初步 的 理论 已 经 讲解 完了 ， 本 小 节 准备 了 一 段 Java 代码 ， 看 看 在 虚拟 机 中 实际 上 是 如 
何 执行 的 。 例 如 在 下 面 的 演示 代码 中 ， 展 示 了 四 则 运算 的 过 程 。 


public class Demo { 
public static void foo() { 
int a= 12 
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} 
这 段 代码 从 Java 语言 的 角度 没有 任何 评论 的 必要 ， 直 接 使 用 javap 命令 看 看 它 的 字 节 


码 指令 。 通 过 javac 编译 ， 可 以 得 到 文件 Demo.class。 通 过 javap 可 以 看 到 foo() 方 法 的 字 节 
码 如 下 : 


一 


iconst 
istore 
iconst 
istore 
iload 0 
iload 1 
iadd 
iconst 5 
去 imul 

0.9: istore 2 
-0 return 
-const lh 
istore 0 
iconst 2 
istore 1 
iload 0 
iload 1 
iadd 

iconst 5 
imul 

9: istore 2 
10: return 


这 说 明 Java 字 节 码 以 1 字 节 为 单元 。 上 面 代码 中 有 11 条 指令 ， 每 条 都 只 占 1 单元 ， 
共 11 单元 一 11 字 节 。 程 序 计 数 器 是 用 于 记录 程序 当前 执行 的 位 置 用 的 。 对 Java 程序 来 
说 ， 每 个 线程 都 有 自己 的 PC。PC 以 字 节 为 单位 记录 当前 运行 位 置 里 方法 开头 的 偏 移 量 。 

每 个 线程 都 有 一 个 Java 栈 ， 用 于 记录 Java 方法 调用 的 “活动 记录 ”(Activation 
Record)。Java 栈 以 帧 (Frame) 为 单位 线程 的 运行 状态 ， 每 调用 一 个 方法 就 会 分 配 一 个 新 的 
栈 帧 压 入 Java 栈 上 ， 每 从 一 个 方法 返回 则 弹出 并 撤销 相应 的 栈 帧 。 

每 个 栈 帧 包括 局 部 变量 区 、 求 值 栈 JVM 规范 中 将 其 称 为 “操作 数 栈 ”) 和 其 他 一 些 信 
息 。 局 部 变量 区 用 于 存储 方法 的 参数 与 局 部 变量 ， 其 中 参数 按 源码 中 从 左 到 右 顺序 保存 在 
局 部 变量 区 开头 的 几 个 slot。 求 值 栈 用 于 保存 求 值 的 中 间 结 果 和 调用 别 的 方法 的 参数 等 。 
两 者 都 以 字 长 (32 位 的 字 ) 为 单位 ， 每 个 slot 可 以 保存 byte、short、char、int、float、 
reference 和 returnAddress 等 长 度 小 于 或 等 于 32 位 类 型 的 数据 ， 相 邻 两 项 可 用 于 保存 long 
和 double 类 型 的 数据 。 每 个 方法 所 需要 的 局 部 变量 区 与 求 值 栈 大 小 都 能 够 在 编译 时 确定 ， 
并 且 记 录 在 .class 文件 里 。 

在 上 面 的 例子 中 ，Demo.foo() 方 法 所 需要 的 局 部 变量 区 大 小 为 3 个 slot， 需 要 的 求 值 栈 
大 小 为 2 个 slot。Java 源码 的 a、b、c 分 别 被 分 配 到 局 部 变量 区 的 slot 0、slot 1 和 slot 2。 
可 以 观察 到 Java 字 节 码 是 如 何 指示 JVM 将 数据 压 入 或 弹出 栈 ， 以 及 数据 是 如 何在 栈 与 局 
部 变量 区 之 前 流动 的 ， 可 以 看 到 数据 移动 的 次 数 特别 多 。 动 画 里 可 能 不 太 明显 ，iadd 和 
imul 指令 都 是 要 从 求 值 栈 弹 出 两 个 值 运算 ， 再 把 结果 压 回 到 栈 上 的 ; 光 这 样 一 条 指令 就 有 
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3 次 概念 上 的 数据 移动 了 。 


Java 的 局 部 变量 区 并 不 需要 把 某 个 局 部 变量 固定 分 配 在 某 个 slot 里 。 不 仅 如 此 ， 在 一 
个 方法 内 某 个 slot 甚至 可 能 保存 不 同类 型 的 数据 。 如 何 分 配 slot 是 编译 器 的 自由 。 从 类 型 
安全 的 角度 看 ， 只 要 对 某 个 slot 的 一 次 load 的 类 型 与 最 近 一 次 对 它 的 store 的 类 型 匹配 ， 
JVM 的 字 节 码 校 验 器 就 不 会 抱怨 。 因 为 这 方面 的 内 容 比较 高 深 ， 读 者 读 懂 需要 很 广 的 知识 


面 ， 所 以 在 本 书 中 不 再 详细 讲解 。 
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在 Class 文件 格式 与 执行 引擎 这 部 分 里 ， 用 户 的 程序 能 直接 影响 的 内 容 并 
不 太 多 ，Class 文件 以 何 种 格式 存储 ， 类 型 何 时 加 载 、 如 何 连 接 ， 以 及 虚拟 机 
如 何 执行 字 节 码 指令 等 都 是 由 虚拟 机 直接 控制 的 行为 ， 用 户 程序 无 法 对 其 进行 
改变 。 能 通过 程序 进行 操作 的 ， 主 要 是 字 节 码 生 成 与 类 加 载 器 这 两 部 分 的 功 
能 ， 但 仅仅 在 如 何 处 理 这 两 点 上 ， 就 已 经 出 现 了 许多 值得 欣赏 和 借鉴 的 思路 ， 
这 些 思路 后 来 成 为 了 许多 常用 功能 和 程序 实现 的 基础 。 本 章 将 详细 讲解 各 种 类 
加 载 器 和 执行 子 系统 的 基本 知识 ， 为 读者 学 习 后 面 的 知识 打下 基础 。 


13.1 分 析 Tomcat 类 加 载 器 的 架构 


主流 的 Java Web 服务 器 ， 例 如 Tomcat、Jetty、WebLogic、WebSphere 都 实现 了 自己 
定义 的 类 加 载 器 。 因 为 一 个 功能 健全 的 Web 服务 器 ， 都 要 解决 如 下 几 个 问题 。 

(1) 部 署 在 同一 个 服务 器 上 的 两 个 Web 应 用 程序 所 使 用 的 Java 类 库 可 以 实现 相互 隔 
离 。 这 是 最 基本 的 需求 ， 两 个 不 同 的 应 用 程序 可 能 会 依赖 同一 个 第 三 方 类 库 的 不 同 版 本 ， 
不 能 要 求 一 个 类 库 在 一 个 服务 器 中 只 有 一 份 ， 服 务 器 应 当 可 以 保证 两 个 应 用 程序 的 类 库 可 
以 互相 独立 使 用 。 

(2) 部 署 在 同一 个 服务 器 上 的 两 个 Web 应 用 程序 所 使 用 的 Java 类 库 可 以 互相 共享 。 这 
个 需求 也 很 常见 ， 例 如 用 户 可 能 有 10 个 使 用 Spring 组 织 的 应 用 程序 部 署 在 同一 台 服 务 器 
上 ， 如 果 把 10 从 Spring 分 别 存放 在 各 个 应 用 程序 的 隔离 目录 中 ， 将 会 是 很 大 的 资源 浪费 
一 一 这 主要 倒 不 是 浪费 磁盘 空间 的 问题 ， 而 是 指 类 库 在 使 用 时 都 要 被 加 载 到 服务 器 内 存 ， 
如 果 类 库 不 能 共享 ， 虚 拟 机 的 方法 区 很 容易 就 会 出 现 过 度 膨胀 的 风险 。 

(3) 服务 器 需要 尽 可 能 地 保证 自身 的 安全 不 受 部 署 的 Web 应 用 程序 影响 。 目 前 ， 有 许 
多 主流 的 Java Web 服务 器 自身 也 是 使 用 Java 语言 来 实现 的 。 因 此 服务 器 本 身 也 有 类 库 依 
赖 的 问题 ， 一 般 来 说 ， 基 于 安全 考虑 ， 服 务 器 所 使 用 的 类 库 应 该 与 应 用 程序 的 类 库 互 相 
独立 。 

(4) 支持 JSP 应 用 的 Web 服务 器 ， 十 有 八 九 都 需要 支持 HotSwap 功能 。 我 们 知道 JSP 
文件 最 终 要 被 编译 成 Java Class 才能 被 虚拟 机 执行 ， 但 JSP 文件 由 于 其 纯 文 本 存储 的 特 
性 ， 被 运行 时 修改 的 概率 远 远 大 于 第 三 方 类 库 或 程序 自己 的 Class 文件 。 而 且 ASP、PHP 
和 JSP 这 些 网 页 应 用 也 把 修改 后 无 须 重启 作为 一 个 很 大 的 “优势 ”来 看 待 ， 因 此 “主流 ” 
的 Web 服务 器 都 会 支持 JSP 生成 类 的 热 蔡 换 ， 当 然 也 有 “ 非 主流 ”的 ， 如 运行 在 生产 模式 
(Production Mode) 下 的 WebLogic 服务 器 默认 就 不 会 处 理 JSP 文件 的 变化 。 

由 于 存在 上 述 问题 ， 在 部 署 Web 应 用 时 ， 单 独 的 一 个 ClassPath 就 无 法 满足 需求 了 ， 
所 以 各 种 Web 服务 器 都 提供 了 好 几 个 ClassPath 路 径 供用 户 存放 第 三 方 类 库 ， 这 些 路 径 一 
般 都 以 “lib” 或 “classes” 命 名 。 被 放置 到 不 同 路 径 中 的 类 库 ， 具 备 不 同 的 访问 范围 和 服 
务 对 象 ， 通 常 ， 每 一 个 目录 都 会 有 一 个 相应 的 自 定义 类 加 载 器 去 加 载 放置 在 里 面 的 Java 类 
库 。 现在， 笔者 就 以 Tomcat 服务 器 为 例 ， 看 一 看 Tomcat 具体 是 如 何 规划 用 户 的 类 库 结构 
和 类 加 载 器 的 。 


13.1.1 Tomcat 目录 结构 


在 Tomcat 目录 结构 中 ， 有 三 组 目录 (“/common/*”、“/server/*” 和 “/shared/*”) 可 
以 存放 Java 类 库 ， 另 外 还 可 以 加 上 Web 应 用 程序 自身 的 目录 “/WEB-INF/*”, 一 共 4 
组 ， 把 Java 类 库 放 置 在 这 些 目 录 中 的 含义 分 别 是 : 
口 ”放置 在 /common 目录 中 : 类 库 可 被 Tomcat 和 所 有 的 Web 应 用 程序 共同 使 用 。 
口 “ 放 置 在 /server 目录 中 : 类 库 可 被 Tomcat 使 用 ， 对 所 有 的 Web 应 用 程序 都 不 
可 见 。 
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口 ”放置 在 /shared 目录 中 : 类 库 可 被 所 有 的 Web 应 用 程序 共同 使 用 ， 但 对 Tomcat 自 
己 不 可 见 。 
口 ”放置 在 /WebApp/WEB-INF 目录 中 : 类 库 仅 仅 可 以 被 此 Web 应 用 程序 使 用 ， 对 
Tomcat 和 其 他 Web 应 用 程序 都 不 可 见 。 
为 了 支持 这 套 目 录 结 构 ， 并 对 目录 里 面 的 类 库 进 行 加 载 和 隔离 ，Tomcat 自 定 义 了 多 个 
类 加 载 器 ， 这 些 类 加 载 器 按照 经 典 的 双亲 委派 模型 来 实现 ， 其 关系 分 别 如 图 13-1 和 图 13-2 
所 示 。 


引用 类 加 载 器 


扩展 类 加 载 器 
系统 类 加 载 器 
Common 类 加 载 器 


%CLASS_PATH% 


BootStrap 


ommorib\ 
\common\endorsed 


\commoniclasses\ 


Catalina 类 加 载 器 


share\Ib\ 
\share\classes\ 


Mserveritk . 
\serven\classes\ 
SharedLoader 


CatalinaLoader 


WebApp 类 加 载 器 


13-1 Tomcat 类 加 载 器 的 架构 13-2 ”Tomcat 类 加 载 器 的 文件 架构 结构 


图 13-2 展示 了 各 层 类 加 载 器 以 及 类 文件 搜索 路 径 ，Tomcat 为 每 个 部 署 到 其 中 的 Web 
项 目 定 义 一 个 类 加 载 器 (如 上 图 中 WebappAClassLoader、WebappBClassLoader)， 其 类 文件 
搜索 路 径 即 为 %CATALINA HOME%\webapps\ 项 目 名 称 \WWEB-INF\ibi%CATALINA_ 
HOME%\webapps\ 项 目 名 称 \WEB-INF\classes\。Tomcat 自己 定义 了 一 个 BootStrap 类 , 在 
org.apache.catalina.startup.BootStrap 定义 。 

CommonClassLoader、CatalinaClassLoader、ShareClassLoader、 和 WebappClassLoader 
是 Tomcat 自 定义 加 载 器 ， 分 别 对 应 加 载 /common/*、/server/*、/shared* 和 /WEB-INF/* 类 
库 ， 其 中 Webapp 类 加 载 器 和 Jsp 类 加 载 器 会 存在 多 个 ， 每 个 Web 应 用 对 应 一 个 Webapp 
类 加 载 器 ， 每 个 JSP 文件 对 应 Jsp 类 加 载 器 。 

CommonClassLoader 加 载 的 类 可 以 被 CatalinaClassLoader 和 ShareClassLoader 使 用 ; 
CatalinaClassLoader 加 载 的 类 和 ShareClassLoader 加 载 的 类 相互 隔离 ;， WebappClassLoader 
可 以 使 用 ShareClassLoader 加 载 的 类 ， 但 各 个 WebappClassLoader 间 相 互 隔离 ; 
JspClassLoader 仅 能 用 JSP 文件 编译 的 Class 文件 。 
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13.1.2 ”定义 公共 类 加 载 器 


在 Tomcat 中 ， 可 以 通过 如 下 代码 定义 类 加 载 器 。 


private Object catalinaDaemon = nul1;// 定 义 catalina 服务 器 守护 程序 实例 
protected ClassLoader commonLoader = null; 

protected ClassLoader catalinaLoader = null; 

protected ClassLoader sharedLoader = null; 


private void initClassLoaders () { 

try { 
ClassLoaderFactory.setDebug (debug) 
commonLoader = createClassLoader ("common", null); 
catalinaLoader = createClassLoader ("server", commonLoader); 
sharedLoader = createClassLoader ("shared", commonLoader); 

} catch (Throwable 七 ) { 
log("Class loader creation threw exception", t+); 
System.exit (1); 


我 们 看 到 commonLoader 的 父 类 加 载 器 为 null， 即 在 委派 机 制 下 它 将 把 类 加 载 任务 直 
接 委 派 给 JVM 所 使 用 的 BootStrap Loader， 但 为 什么 是 null 呢 ? 因为 JVM 所 使 用 的 
BootStrap Loader 是 用 C++ 编写 的 。 

catalinaDaemon 为 服务 器 从 启动 至 停止 都 存在 的 守护 线程 ， 类 似 于 桌面 程序 中 的 Main 
守护 线程 。createClassLoader 函数 利用 ClassLoaderFactory 类 在 工厂 模式 下 创建 ， 创 建 代 码 
如 下 : 


public static ClassLoader createClassLoader (File unpacked[],File 
packed[], URL urls[], ClassLoader parent)throws Exception { 


// 获 得 将 要 创建 的 类 加 载 器 的 类 文件 搜索 路 径 
String array[] = (String[]) 1ist.toarray (new String[list.size()]); 
StandardClassLoader classLoader = null; 
if (parent == null)// 父 加 载 器 为 JVM 使 用 的 Bootstrap Loader 
classLoader = new StandardClassLoader (array); 
else 
classLoader = new StandardClassLoader (array, parent); 
classLoader.setDelegate (true) ;// 设 置 该 类 加 载 器 遵循 委派 模式 


return (classLoader); 

Tomcat 提供 两 种 类 加 载 器 供 使 用 : 一 种 是 如 上 代码 中 所 述 的 标准 类 加 载 器 
StandardClassLoader， 用 以 实例 化 为 commonLoader 、catalinaLoader 和 sharedLoader 在 
org.apache.catalina.loader.StandardClassLoader 中 定义 ， 它 不 提供 热 部 署 功能 ， 另 外 一 种 是 
专 为 Web 程序 所 提供 的 WebClassLoader， 它 用 以 实例 化 为 各 部 署 项 目的 类 加 载 器 ， 在 
org.apache.catalina.loader.WebappClassLoader 中 定义 ， 提 供 热 部 署 功能 ， 也 就 是 在 发 生 
ClassLoader 搜索 路 径 下 的 资源 改变 的 动作 之 后 ， 服 务 器 自动 重新 加 载 之 。 
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13.1.3 ”初始 化 catalina 守护 程序 
下 面 是 Tomcat 初始 化 catalina 守护 程序 的 具体 代码 。 


Public void init() 
throws Exception 

{ 
// Set Catalina path 
setCatalinaHome (); 
setCatalinaBase (); 


initClassLoaders (); 
Thread.currentThread () .setContextClassLoader (catalinaLoader); 
SecurityClassLoad.securityClassLoad (catalinaLoader); 
/* 利 用 类 加 载 器 catalinaclassLoader 加 载 catalina， 并 调用 后 者 的 process 方法 ， 
该 方法 设置 6CATALINA HOME%, $CATALINA BASE%， 并 根据 参数 配置 启动 catalina*/ 
Class startupClass = 
catalinaLoader.1loadClass 
("org.apache.catalina.startup.Catalina"); 
Object startupInstance = startupClass.newInstance(); 
/* 将 SharedclassLoader 设 为 Catalina 类 的 classLoader*/ 
String methodName = "setParentClassLoader"; 
Class paramTypes[] = new Class[1]; 
paramTypes[0] = Class.forName ("java.lang.ClassLoader"); 
Object paramValues[] = new Object[1]; 
paramValues[0] = sharedLoader; 
Method method = 
startupInstance.getClass () .getMethod (methodName, paramTypes); 
method.invoke (startupInstance, paramValues); 
catalinaDaemon = startupInstance; 
} 


本 段 代 码 实现 了 利用 CatalinaClassLoader 加 载 Catalina 类 ， 并 创建 其 实例 。 有 意思 的 
是 ， 创 建 实例 之 后 Catalina 的 类 加 载 器 却 被 设置 为 SharedClassLoader。 

我 们 知道 Catalina 是 Tomcat 容器 的 代言 人 ， 也 就 是 一 个 在 容器 生命 周期 内 都 存在 的 
类 ， 我 们 所 设计 的 Servlet 是 被 放置 在 这 个 容器 里 面 供 调用 的 ， 从 代码 层 来 讲 也 就 是 被 实例 
化 ， 然 后 引用 。 同 时 ， 在 Java 类 加 载 器 体系 结构 中 定义 到 : 被 引用 类 默认 由 依赖 类 的 
ClassLoader 加 载 ， 而 这 样 设计 的 原因 是 ， 运 行 时 相同 层次 的 ClassLoader 所 加 载 的 类 无 法 
看 到 其 他 ClassLoader 所 加 载 的 类 ， 可 这 又 是 为 什么 呢 ? 这 是 Java 语言 的 安全 特性 所 要 求 
的 。 由 上 所 述 ， 可 以 知道 如 果 要 引用 Servlet 的 话 ， 得 由 Catalina 的 ClassLoader 去 加 载 ， 
但 是 我 们 之 前 已 经 看 到 了 ， 每 一 个 Web 项 目 都 有 一 个 特定 的 WebappClassLoder 加 载 ， 并 
且 Catalina 需要 引用 的 可 是 同时 部 署 到 其 中 的 许多 个 Web 项 目的 Servlet， 这 就 出 现 了 了 矛 
盾 。 但 是 ， 我 们 仔细 看 看 WebappClassLoader 的 设计 ， 它 的 父 加 载 器 是 
SharedClassLoader，SharedClassLoader 加 载 的 是 部 署 到 容器 中 的 多 个 Web 项 目 共 用 的 资 
源 ， 所 以 将 Catalina 的 类 加 载 器 设置 为 SharedClassLoader， 这 样 利用 父 加 载 器 加 载 
Catalina， 而 用 子 加 载 器 来 加 载 Served。 
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13.1.4 Tomcat 内 部 初始 化 类 加 载 器 


在 初步 了 解 了 Tomcat 关于 类 加 载 器 的 一 些 知 识 后 ， 接 下 来 详细 看 看 Tomcat 内 部 是 怎 
么 来 初始 化 这 些 类 加 载 器 的 。 首 先 ，Java 程序 都 需要 一 个 入 口 (main 方法 )， 而 在 tomcat 
中 ， 这 个 入 口 在 org.apache.catalina.startup.Bootstrap 这 个 类 中 ， 其 结构 如 图 13-3 所 示 。 


ed 
-DF Bootstrap 
BF CATALINA BASE TOKEN : String 
BF CATALINA_ HONE_TOKEN : String 
oS daemon : Bootstrap 
oslog: Log 


© 5 getCatalinaBase ( 
© 5 getCatalinallome () 


catalinallaemon . Dbject 
catalinaLoader ; ClassLoader 
commonLoader : ClassLoader 
sharedLoader : ClassLoader 
createClassLoader (String, ClassLoader) 
destroy | 

BetAwait () 

init 0 

init (String[]) 
initClassLoaders () 

load (Strine[]) 

SetAwait (boolean) 
setCatalinaBase () 
setCatalinapase (Strine) 
setCatalinaHome () 
setCatalinaHome (String) 
start 

stop 0) 

stopServer () 


stopServer (String[]) 
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图 13-3 ”类 Bootstrap 的 结构 
如 果 定 位 到 方法 内 部 ， 其 代码 如 下 。 


public static void main (String args[]) { 
if (daemon 一 null) { 
daemon = new Bootstrap(); 
下 
// 初 始 化 资源 (今天 来 了 解 的 .) 

daemon.init (); 

} catch (Throwable t) { 
七 .printStackTrace (); 
return; 


[70 
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// 默 认为 启动 
String command = "start"; 
if (args.length > 0) { 
Command = args [args.length - 1]; 
} 


if (command.equals("startd")) { 
args [args.length - 1] = "Start"7 
daemon .load (args); 
daemon .start() 7 

} else if (command.equals ("stopd")) { 
args [args.length - 1] = "stop"; 
daemon.stop () 7 

} else if (command.equals ("start")) { 

// 设 置 标识 

daemon .setAwait (true) 7 
daemon.1load (args); 
// 开 启 
daemon.start (); 

} else if (command.equals("stop")) { 
daemon .stopServer (args); 

} else { 
log.warn ("Bootstrap: command \"" + command + "\" does not exist."); 

} 

} catch (Throwable t) { 
七 .printStackTrace (); 
下 
下 


在 Tomcat 启动 之 前 ， 需 要 初始 化 一 些 系统 资源 ， 初 始 化 的 详细 工作 都 定义 在 init0 方 
法 内 部 了 。 
接 下 来 继续 追踪 ， 定 位 到 init0 方 法 中 ， 代 码 如 下 。 


public void init() 
throws Exception 
{ 
// Set Catalina path 设置 catalina 基本 路 径 
setCatalinaHome (); 
setCatalinaBase(); 


// 初 始 化 类 加 载 器 


initClassLoaders (); 


Thread.currentThread() .setContextClassLoader (catalinaLoader); 
SecurityClassLoad.securityClassLoad (catalinaLoader); 
// Load our startup class and call its process() method 
if (log.isDebugEnabled()) 
log.debug ("Loading startup class") 7 
Class startupClass = 
catalinaLoader .loadCclass ("org.apache.catalina.startup.Catalina"); 
Object startupInstance = startupClass.newInstance(); 
// Set the shared extensions class loader 
if (log.isDebugEnabled()) 
log.debug ("Setting startup class properties"); 
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String methodName = "setParentClassLoader"7 

Class paramTypes[] = new Class[1]; 

paramTypes[0] = Class.forName ("java.lang.ClassLoader"); 

Object paramValues[] = new Object[1]; 

paramValues[0] = sharedLoader; 

Method method =startupInstance.getClass () .getMethod (methodName, 
paramTypes); 

method.invoke (startupInstance, paramValues); 

catalinaDaemon = startupInstance; 

} 


由 此 可 以 看 到 ， 上 面 的 代码 中 ， 用 来 初始 化 类 加 载 器 、 验 证 类 加 载 器 ， 以 及 使 用 类 加 
载 器 来 加 载 类 org.apache.catalina.startup.Catalina 等 操作 。Tomcat 会 调用 initClassLoaders() 
方法 ， 用 来 初始 化 common、catalina 和 shared 三 种 类 加 载 器 ， 而 这 个 操作 是 通过 方法 
createClassLoader(String name, ClassLoader parent) 来 完成 的 ， 而 后 两 个 都 属于 common 的 子 
级 ， 所 以 下 面 给 出 两 个 方法 的 源 代码 。 
/** 
* 初始 化 类 加 载 器 : 
* 加 载 三 种 : 
common. 
下 入 
* Catalina shared. 
六 
private void initClassLoaders () { 
try { 
// 创 建 common 类 加 载 器 
commonLoader = createClassLoader ("common", null); 
if( commonLoader == null ) { 
// no config file, default to this loader - we might be in 
a 'single' env. 
commonLoader=this.getClass() .getClassLoader (); 


L 
/ /创建 catalina 类 加 载 器 , 指定 其 父 级 别 的 加 载 器 为 commonLoader . 
catalinaLoader = createClassLoader ("server", commonLoader) 
/ /创建 sharedLoader 类 加 载 器 , 指定 其 父 级 别 的 加 载 器 为 commonLoader. 
sharedLoader = createClassLoader ("shared", commonLoader) 

} catch (Throwable 七 ) { 
log.error ("Class loader creation threw exception"，t) ; 
System.exit (1); 


7 


创建 类 加 载 器 


param name 

eparam parent 指定 上 一 级 别 的 类 加 载 器 
Qreturn 

Qthrows Exception 


E20 


ek 
private ClassLoader createClassLoader (String name, ClassLoader parent) 
throws Exception { 


// 这 里 以 common 为 例 : 从 catalina .properties 中 获取 common .loader 类 加 载 信息 


KE 
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// 如 : 
//common.loader=$ {catalina.home}/lib, ${catalina.home}/l1ib/*.jar 
String value = CatalinaProperties.getProperty (name + ".loader"); 
// 如 果 没 有 任何 信息 ， 则 返回 父 加 载 器 
if ((value == null) || (value.equals(""))) 
return parent; 


ArrayList repositoryLocations = new ArrayList(); 
ArrayList repositoryTypes = new ArrayList(); 

nt ys 

// 以 逗号 分 隔 . 


StringTokenizer tokenizer = new StringTokenizer(value, ","); 


while (tokenizer.hasMoreElements()) { 
String repository = tokenizer.nextToken(); 
// Local repository 
boolean replace = false; 
String before = repository; 
// 是 否 含 有 "${catalina.home}" 
while ((i=repository.indexOf (CATALINA HOME TOKEN))>=0) { 
replace=true; 
LE (LSON 
// 蔡 换 成 tomcat 路 径 ， 蔡 换 后 的 形式 如 下 : 
c:/opensource/tomcat5/1ib. 
repository = repository.substring(0,i) + getCatalinaHome () 
+ repository.substring (i+CATALINA HOME TOKEN.length()); 
} else { 
repository = getCatalinaHome () 
+ repository.substring (CATALINA HOME TOKEN.length()); 


3 


} 
// 是 否 含 有 "${catalina.base}" 
while ((i=repository.indexOf (CATALINA BASE TOKEN))>=0) { 
replace=true; 
EE LO 区 
// 同 上 ， 蔡 换 
repository = repository.substring(0,i) + getCatalinaBase () 
+ repository.substring (i+CATALINA BASE TOKEN .length() ) 7 
} else { 
repository = getCatalinaBase() 
+ repository.substring (CATALINA BASE TOKEN.length()); 
} 


} 
if (replace && 10g.isDebugEnabled()) 
log.debug ("Expanded " + before + " to " + repository); 


// Check for a JAR URL repository 

try { 
URL url=new URL(repository); 
repositoryLocations.add (repository); 
repositoryTypes.add (ClassLoaderFactory.IS URL); 
continue; 

} catch (MalformedURLException e) { 
// Ignore 
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if (repository.endsWith("*.jar")) { 
repository = repository.substring 
(0, repository.length() - "*.jar".length()); 
repositoryLocations.add (repository); 
repositoryTypes.add (ClassLoaderFactory.IS GLOB); 
} else if (repository-endsWith(".jar")) { 
repositoryLocations.add (repository); 
repositoryTypes.add (ClassLoaderFactory.IS JAR); 


} else { 
repositoryLocations.add (repository); 
repositoryTypes.add (ClassLoaderFactory.ISs DIR); 


String[] locations = (String[]) repositoryLocations.toArray (new 


string[0]); 
Integer[] types = (Integer[]) repositoryTypes.toArray (new 


Integer[0]); 


/ /创建 类 加 载 器 


ClassLoader classLoader = ClassLoaderFactory.createClassLoader 
(locations, types, parent); 


// Retrieving MBean server 


MBeanServer mBeanSserver = null; 
if (MBeanServerFactory.findMBeanServer (null) .size() > 0) { 


mBeanServer = 
(MBeanServer) 
MBeanServerFactory.findMBeanServer (null) .get (0); 


} else { 
mBeanServer = ManagementFactory.getPlatformMBeanServer () 7 


1 
// Register the server classloader 


ObjectName objectName = 
new ObjectName ("Catalina:type=ServerClassLoader, name=" + name); 


mBeanServer.registerMBean (classLoader, objectName); 
return classLoader; 
} 


到 此 为 止 ， 已 经 了 解 了 Tomcat 初始 化 类 加 载 器 的 过 程 。 可 能 有 的 读者 觉得 还 是 不 太 
理解 ， 下 面 是 笔者 总 结 的 加 载 顺 序 。 

(1) 准备 要 启动 Tomcat， 调 用 Bootstrap 的 main 方法 。 

(2) 在 Tomcat 启动 之 前 ， 需 要 加 载 类 ， 就 需要 类 加 载 器 。 于 是 调用 方法 完成 初始 化 工 
作 init0。 

(3) init0 方 法 开始 工作 后 再 去 调用 initClassLoaders() 方 法 。 

(4) 发 现 需要 初始 化 3 个 类 型 的 类 加 载 器 ， 再 调用 createClassLoader (name.parent)， 通 
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过 此 方法 告诉 它 要 初始 化 哪 种 类 型 的 。 

(5) 通过 CatalinaProperties 类 去 联络 catalina.properties， 获 得 哪 种 类 加 载 器 加 载 哪 些 类 
的 信息 。 

(6) 完成 初始 化 ， 并 返回 结果 。 

(7) Tomcat 加 载 其 他 资源 ( 待 续 )， 启 动 成 功 。 

由 此 可 见 ，Tomcat 加 载 器 的 实现 清晰 易 懂 ， 并 且 采 用 了 官方 推荐 的 “正统 ”的 使 用 类 
加 载 器 的 方式 。 如 果 读 者 阅读 完 上 面 的 案例 后 ， 能 毫 不 费力 地 完全 理解 Tomcat 设计 团队 
这 样 布置 加 载 器 架构 的 用 意 ， 那 说 明 您 已 经 大 致 掌握 了 类 加 载 器 “主流 ”的 使 用 方式 ， 那 
么 笔者 不 妨 再 提 一 个 问题 让 各 位 思考 一 下 : 如 果 有 10 个 Web 应 用 程序 都 是 用 Spring 来 进 
行 组 织 和 管理 的 话 ， 可 以 把 Spring 放 到 Common 或 Shared 目录 下 让 这 些 程序 共享 。Spring 
要 对 用 户 程序 的 类 进行 管理 ， 自 然 要 能 访问 到 用 户 程序 的 类 ， 而 用 户 的 程序 显然 是 放 在 
/WebApp/WEB-INF 目录 中 的 。 


13.2 OSGi 的 类 加 载 器 架构 


OSGi 是 Open Service Gateway Initiative 的 缩写 ， 是 OSGi 联盟 (OSGi Alliance) 制 订 的 
一 个 基于 Java 语言 的 动态 模块 化 规范 ， 这 个 规范 最 初 由 Sun、IBM、 爱 立信 等 公司 联合 发 
起 ， 目 的 是 使 服务 提供 商 通过 住宅 网 关 为 各 种 家 用 智能 设备 提供 各 种 服务 ， 后 来 这 个 规范 
在 Java 的 其 他 技术 领域 也 有 相当 不 错 的 发 展 ， 现 在 已 经 成 为 Java 世界 中 “事实 上 ”的 模 
块 化 标准 ， 并 且 已 经 有 了 Equinox、Felix 等 成 熟 的 实现 。OSGi 在 Java 程序 员 中 最 著名 的 
应 用 案例 就 是 Eclipse IDE， 另 外 还 有 许多 大 型 的 软件 平台 和 中 间 件 服务 器 都 基于 或 声明 将 
会 基于 OSGi 规范 来 实现 ， 如 IBM Jazz 平台 、GlassFish 服务 器 、Weblogic10.3 所 使 用 的 
mSA 架构 等 。 

OSGi 中 的 每 个 模块 ( 称 为 Bundle) 与 普通 的 Java 类 库 区 别 并 不 太 大 ， 两 者 一 般 都 以 
JAR 格式 进行 封装 ， 并 且 内 部 存储 的 都 是 Java Package 和 Class。 但 是 一 个 Bundle 可 以 声 
明 它 所 依赖 的 Java Package( 通 过 Import-Package 描述 )， 也 可 以 声明 它 允 许 导出 发 布 的 Java 
Package( 通 过 Export-Package 描述 )。 在 OSGi 里 面 ，Bundle 之 间 的 依赖 关系 从 传统 的 上 层 
模块 依赖 底层 模块 转变 为 平 级 模块 之 间 的 依赖 (至 少 外 观 上 是 如 此 )， 而 且 类 库 的 可 见 性 能 
得 到 了 非常 精确 的 控制 ， 一 个 模块 里 只 有 被 Export 过 的 Package 才 可 能 被 外 界 访问 ， 其 他 
的 Package 和 Class 将 会 被 隐藏 起 来 。 除 了 更 精确 的 模块 划分 和 可 见 性 控制 外 ， 引 入 OSGi 
的 另外 一 个 重要 理由 是 ， 基 于 OSGi 的 程序 很 可 能 (只 是 很 可 能 ， 并 不 是 一 定 会 ) 可 以 实现 
模块 级 的 热 插 拔 功能 ， 当 程序 升级 更 新 或 调试 除 错 时 ， 可 以 只 停 用 、 重 新 安装 ， 然 后 启用 
程序 其 中 的 一 部 分 ， 这 对 企业 级 程序 开发 来 说 是 一 个 非常 有 诱惑 力 的 特性 。 

OSGi 之 所 以 能 有 上 述 诱 人 的 特点 ， 要 归功 于 它 灵 活 的 类 加 载 器 架构 。OSGi 的 Bundle 
类 加 载 器 之 间 只 有 规则 ， 没 有 固定 的 委派 关系 。 例 如 ， 某 个 Bundle 声明 了 一 个 它 依赖 的 
Package， 如 果 有 其 他 Bundle 声明 发 布 了 这 个 Package 后 ， 那 么 对 这 个 Package 的 所 有 类 加 
载 动作 都 会 委派 给 发 布 它 的 Bundle 类 加 载 器 去 完成 。 不 涉及 某 个 具体 的 Package 时 ， 各 个 
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Bundle 加 载 器 都 是 平 级 的 关系 ， 只 有 具体 使 用 到 某 个 Package 和 Class 的 时 候 ， 才 会 根据 
Package 导入 导出 定义 来 构造 Bundle 间 的 委派 和 依赖 。 

另外 ， 一 个 Bundle 类 加 载 器 为 其 他 Bundle 提供 服务 时 ， 会 根据 Export-Package 列表 
严格 控制 访问 范围 。 如 果 一 个 类 存在 于 Bundle 的 类 库 中 但 是 没有 被 Export， 那 么 这 个 
Bundle 的 类 加 载 器 能 找到 这 个 类 ， 但 不 会 提供 给 其 他 Bundle 使 用 ， 而 且 OSGi 平台 也 不 会 
把 其 他 Bundle 的 类 加 载 请 求 分 配给 这 个 Bundle 来 处 理 。 

我 们 可 以 举 一 个 更 具体 一 些 的 简单 例子 ， 假 设 存在 Bundle A、Bundle B 和 Bundle C 
三 个 模块 ， 并 且 这 三 个 Bundle 定义 的 依赖 关系 为 : 

口 Bundle A: 声明 发 布 了 packageA， 依 赖 了 java.* 的 包 ; 

口 Bundle B: 声明 依赖 了 packageA 和 packageC， 同 时 也 依赖 了 java.* 的 包 ; 

口 Bundle C: 声明 发 布 了 packageC， 依 赖 了 packageA。 

那么 ， 这 三 个 Bundle 之 间 的 类 加 载 器 及 父 类 加 载 器 之 间 的 关系 如 图 13-4 所 示 。 


父 类 加 载 器 
了 ParentClassLoader 


个 


BundleA 类 加 载 器 
BundlaAClassLoadar 


个 个 


BundleC 类 加 载 器 ”| 他 | ”BuntlleB 类 加 载 器 
BundleCClassLoader ~、 | BundleBClassLoader 
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由 此 可 以 看 出 ，OSGi 类 加 载 器 之 间 不 再 是 双亲 委派 模型 的 树 形 结构 ， 而 是 进一步 发 
展 成 为 一 种 运行 时 才能 确定 的 网 状 结构 。 这 种 网 状 类 加 载 器 结构 拥有 更 优秀 的 灵活 性 ， 
同时 也 有 许多 隐患 ， 由 于 各 模块 间 依赖 关系 错综复杂 ， 高 并 发 量 下 容易 发 生死 锁 等 问题 。 

由 于 没有 牵涉 到 具体 的 OSGi 实现 ， 图 中 的 类 加 载 器 都 没有 指明 具体 的 加 载 器 实现 ， 
只 是 一 个 体现 了 加 载 器 间 关 系 的 概念 模型 ， 并 且 只 是 体现 了 OSGi 中 最 简单 的 加 载 器 委派 
关系 。 一 般 来 说 ， 在 OSGi 里 ， 加 载 一 个 类 可 能 发 生 的 查找 行为 和 委派 关系 会 比 图 13-4 中 
显示 的 复杂 得 多 ， 类 加 载 时 可 能 进行 的 查找 规则 如 下 : 

以 java.* 开 头 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 

口 ” 否则， 委派 列表 名 单 内 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 

口 “ 否 则 ，Import 列表 中 的 类 ， 委 派 给 Export 这 个 类 的 Bundle 的 类 加 载 器 加 载 。 

口 否则， 查找 当前 Bundle 的 Classpath， 使 用 自己 的 类 加 载 器 加 载 。 

口 “ 否 则 ， 查 找 是 否 在 自己 的 Fragment Bundle 中 ， 如 果 是 则 委派 给 Fragment Bundle 

的 类 加 载 器 加 载 。 
口 否则， 查找 Dynamic Import 列表 的 Bundle， 委 派 给 对 应 Bundle 的 类 加 载 器 
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加 载 。 

口 ”否则 ， 类 查找 失败 。 

从 图 13-4 中 还 可 以 看 出 ， 在 OSGi 里 面 ， 加 载 器 之 间 的 关系 不 再 是 双亲 委派 模型 的 树 
形 结构 ， 而 是 已 经 进一步 发 展 成 了 一 种 运行 时 才能 确定 的 网 状 结构 。 这 种 网 状 的 类 加 载 器 
架构 在 带 来 更 优秀 的 灵活 性 的 同时 ， 也 可 能 会 产生 许多 新 的 隐患 。 笔 者 曾经 参与 过 将 一 个 
非 OSGi 的 大 型 系统 向 Equinox OSGi 平 台 迁 移 的 项 目 ， 由 于 历史 原因 ， 代 码 模块 之 间 的 依 
赖 关系 错综复杂 ， 勉 强 分 离 出 各 个 模块 的 Bundle 后 ， 发 现在 高 并 发 环境 下 经 常 出 现 死 锁 。 
我 们 很 容易 就 找到 了 死 锁 的 原因 : 如 果 出 现 了 Bundle A 依赖 Bundle B 的 Package B, 而 
Bundle B 又 依赖 了 Bundle A 的 Package A， 这 两 个 Bundle 进行 类 加 载 时 就 很 容易 发 生死 
锁 。 具 体 情况 是 当 Bundle A 加 载 Package B 的 类 时 ， 首 先 需要 锁定 当前 类 加 载 器 的 实例 对 
象 (java.lang.ClassLoader.loadClass() 是 一 个 synchronized 方法 )， 然 后 把 请 求 委派 给 Bundle B 
的 加 载 器 处 理 ， 但 如 果 这 时 候 Bundle B 也 正好 想 加 载 Package A 的 类 ， 它 也 先 锁定 自己 的 
加 载 器 再 去 请 求 Bundle A 的 加 载 器 处 理 ， 这 样 两 个 加 载 器 都 在 等 待 对方 处 理 自己 的 请 求 ， 
而 对 方 处 理 完 之 前 自己 又 一 直 处 于 同步 锁定 的 状态 ， 因 此 它们 就 互相 死 锁 ， 永 远 无 法 完成 
加 载 请 求 了 。Equinox 的 Bug List 中 也 有 关于 这 类 问题 的 Bug， 并 提供 了 一 个 以 牺牲 性 能 
为 代价 的 解决 方案 一 一 用 户 可 以 启用 osgi.classloader.singleThreadLoads 参数 来 按 单 线程 串 
行 化 的 方式 强制 进行 类 加 载 动 作 。 在 JDK 17 中 ， 将 会 为 非 树 状 继承 关系 下 的 类 加 载 器 架 
构 进 行 一 次 专门 的 升级 ， 希 望 从 底层 避免 这 类 死 锁 状况 ， 这 个 动作 也 是 为 将 来 实现 “官方 
的 ”模块 化 规范 (与 前 文 所 提 的 OSGi 是 “事实 上 ”的 模块 化 规范 对 应 )JSR-297、JSR-277 
做 准备 。 

总 体 来 说 ，OSGi 描绘 了 一 个 很 美好 的 模块 化 开发 的 目标 ， 而 且 定 义 了 实现 这 个 目标 
所 需要 的 各 种 服务 ， 同 时 也 有 成 熟 框 架 对 其 提供 实现 支持 。 对 于 单个 虚拟 机 下 的 应 用 ， 从 
开发 初期 就 建立 在 OSGi 上 是 一 个 很 不 错 的 选择 ， 这 样 便于 约束 依赖 。 但 并 非 所 有 的 应 用 
都 适合 采用 OSGi 作为 基础 架构 ，OSGi 在 提供 强大 功能 的 同时 ， 也 引入 了 额外 的 复杂 度 ， 
带 来 了 线程 死 锁 和 内 存 泄 漏 的 风险 。 


13.3 ” 字 节 码 生 成 技术 


“ 字 节 码 生 成 ”并 不 是 什么 高 深 的 技术 ， 读 者 在 看 到 “ 字 节 码 生成 ”这 个 标题 时 也 不 
必 先 去 想 诸如 JaVassist、CGLib 和 ASM 之 类 的 字 节 码 类 库 ， 因 为 JDK 里 面 的 javac 命令 
就 是 字 节 码 生成 技术 的 “ 老 祖 宗 ”， 并 且 javac 也 是 一 个 由 Java 语言 写成 的 程序 ， 它 的 代 
码 存放 在 OpenjDK 的 jdk7/langtools/src/share/classes/com/sun/tools/javac 目录 中 。 

要 深入 了 解 字 节 码 生成 ， 阅 读 javac 的 源码 是 个 很 好 的 途径 ， 不 过 javac 对 于 我 们 这 个 
例子 来 说 太 过 庞大 了 。 在 Java 里 面 除 了 javac 和 字 节 码 类 库 外 ， 使 用 到 字 节 码 生成 的 例子 
还 有 很 多 ， 如 Web 服务 器 中 的 JSP 编译 器 ， 编 译 时 织 入 的 AOP 框架 ， 还 有 很 常用 的 动态 
代理 技术 ， 甚 至 在 使 用 反射 的 时 候 虚拟 机 都 有 可 能 会 在 运行 时 生成 字 节 码 来 提高 执行 速 
度 。 我 们 选择 其 中 相对 简单 的 动态 代理 来 看 看 字 节 码 生 成 技术 是 如 何 影响 程序 运作 的 。 

其 实 Java 编译 程序 将 Java 源 程序 翻译 为 JVM 可 执行 代码 ? 字 节 码 。 这 一 编译 过 程 同 
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C/C++ 的 编译 有 些 不 同 。 当 C 编译 器 编译 生成 一 个 对 象 的 代码 时 ， 该 代码 是 为 在 某 一 特定 
硬件 平台 运行 而 产生 的 。 因 此 ， 在 编译 过 程 中 ， 编 译 程序 通过 查 表 将 所 有 对 符号 的 引用 转 
换 为 特定 的 内 存 偏 移 量 ， 以 保证 程序 运行 。Java 编译 器 却 不 将 对 变量 和 方法 的 引用 编译 为 
数值 引用 ， 也 不 确定 程序 执行 过 程 中 的 内 存 布局 ， 而 是 将 这 些 符 号 引用 信息 保留 在 字 节 码 
中 ， 由 解释 器 在 运行 过 程 中 创立 内 存 布局 ， 然 后 再 通过 查 表 来 确定 一 个 方法 所 在 的 地 址 。 
这 样 就 有 效 地 保证 了 Java 的 可 移植 性 和 安全 性 。 

运行 JVM 字 节 码 的 工作 是 由 解释 器 来 完成 的 。 解 释 执 行 过 程 分 三 部 进行 ; 代码 的 装 
入 、 代 码 的 校 验 和 代码 的 执行 。 装 入 代码 的 工作 由 “类 装载 器 ”(Class Loader) 完 成 。 类 装 
载 器 负责 装 入 运行 一 个 程序 需要 的 所 有 代码 ， 这 也 包括 程序 代码 中 的 类 所 继承 的 类 和 被 其 
调用 的 类 。 当 类 装载 器 装 入 一 个 类 时 ， 该 类 被 放 在 自己 的 名 字 空 间 中 。 除 了 通过 符号 引用 
自己 名 字 空间 以 外 的 类 ， 类 之 间 没有 其 他 办 法 可 以 影响 其 他 类 。 在 本 台 计 算 机 上 的 所 有 类 
都 在 同一 地 址 空间 内 ， 而 所 有 从 外 部 引进 的 类 ， 都 有 一 个 自己 独立 的 名 字 空 间 。 这 使 得 本 
地 类 通过 共享 相同 的 名 字 空间 获得 较 高 的 运行 效率 ， 同 时 又 保证 它们 与 从 外 部 引进 的 类 不 
会 相互 影响 。 当 装 入 了 运行 程序 需要 的 所 有 类 后 ， 解 释 器 便 可 确定 整个 可 执行 程序 的 内 存 
布局 。 解 释 器 为 符号 引用 同 特定 的 地 址 空间 建立 对 应 关系 及 查询 表 。 通 过 在 这 一 阶段 确定 
代码 的 内 存 布局 ，Java 很 好 地 解决 了 由 超 类 改变 而 使 子 类 毅 溃 的 问题 ， 同 时 也 防止 了 代码 
对 地 址 的 非法 访问 。 

随后 ， 被 装 入 的 代码 由 字 节 码 校 验 器 进行 检查 。 校 验 器 可 发 现 操作 数 栈 溢 出 ， 非 法 数 
据 类 型 转化 等 多 种 错误 。 通 过 校 验 后 ， 代 码 便 开 始 执行 了 。 

Java 字 节 码 的 执行 有 如 下 两 种 方式 : 

(1) 即时 编译 方式 : 解释 器 先 将 字 节 码 编译 成 机 器 码 ， 然 后 再 执行 该 机 器 码 。 

(2) 解释 执行 方式 :解释 器 通过 每 次 解释 并 执行 一 小 段 代码 来 完成 Java 字 节 码 程 序 
的 所 有 操作 。 

通常 采用 的 是 第 二 种 方法 。 由 于 JVM 规格 描述 具有 足够 的 灵活 性 ， 这 使 得 将 字 节 码 
翻译 为 机 器 代码 的 工作 具有 较 高 的 效率 。 对 于 那些 对 运行 速度 要 求 较 高 的 应 用 程序 ， 解 释 
器 可 将 Java 字 节 码 即 时 编译 为 机 器 码 ， 从 而 很 好 地 保证 了 Java 代码 的 可 移植 性 和 高 
性 能 。 


13.4 动态 代理 


所 谓 动态 代理 ， 就 是 在 程序 运行 的 时 候 ，JVM 能 动态 的 知道 它 要 对 哪个 类 的 哪些 方法 
进行 代理 ， 以 此 实现 程序 的 可 重用 性 ， 也 减少 了 程序 员 的 劳动 量 。 代 理 是 一 种 常用 的 设计 
模式 ， 其 目的 就 是 为 其 他 对 象 提 供 一 个 代理 以 控制 对 某 个 对 象 的 访问 。 本 节 将 简单 介绍 动 
态 代 理 的 基本 知识 。 


13.4.1 代理 模式 


代理 类 负责 为 委托 类 预 处 理 消息 ， 过 滤 消 息 并 转发 消息 ， 以 及 进行 消息 被 委托 类 执行 
后 的 后 续 处 理 。 例 如 图 13-5 所 示 的 代理 模式 结构 。 
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request 
国 - 一。 
三 于 


Subject 


$doSomething{ > 


Roalsubiect 
| 


SdoSomething() 
SdoOtherthing() 


13-5 ”代理 模式 结构 


为 了 保持 行为 的 一 臻 性， 代理 类 和 委托 类 通常 会 实现 相同 的 接口 ， 所 以 在 访问 者 看 来 
两 者 没有 丝毫 的 区 别 。 通 过 代理 类 这 中 间 一 层 ， 能 有 效 控制 对 委托 类 对 象 的 直接 访问 ， 
也 可 以 很 好 地 隐藏 和 保护 委托 类 对 象 ， 同 时 也 为 实施 不 同 控制 策略 预 留 了 空间 ， 从 而 在 设 
计 上 获得 了 更 大 的 灵活 性 。Java 动态 代理 机 制 以 巧妙 的 方式 近乎 完美 地 实践 了 代理 模式 的 
设计 理念 。 

相信 许多 Java 开发 人 员 都 使 用 过 动态 代理 ， 即 使 没有 直接 使 用 过 java.lang reflect. 
Proxy 或 实现 过 java.lang.re flect.InvocationHandler 接口 ， 应 该 也 用 过 Spring 来 做 过 Bean 的 
组 织 管理 。 如 果 使 用 过 Spring， 那 大 多 数 情况 下 就 都 用 过 动态 代理 ， 因 为 如 果 Bean 是 面 
向 接口 编程 ， 那 么 在 Spring 内 部 则 都 是 通过 动态 代理 的 方式 来 对 Bean 进行 增强 的 。 

动态 代理 中 所 谓 的 “动态 ”， 是 针对 使 用 Java 代码 实际 编写 了 代理 类 的 “静态 ”代理 
而 言 的 ， 它 的 优势 不 在 于 省 去 了 编写 代理 类 那 一 点 工作 量 ， 而 是 实现 了 可 以 在 原始 类 和 接 
口 还 未 知 的 时 候 ， 就 确定 代理 类 的 代理 行为 ， 当 代理 类 与 原始 类 脱离 直接 联系 后 ， 就 可 以 
很 灵活 地 重用 于 不 同 的 应 用 场景 之 中 。 

通过 JDK 的 动态 代理 特性 ， 可 以 为 任意 Java 对 象 创建 代理 对 象 ， 对 于 具体 使 用 来 
说 ， 这 个 特性 是 通过 Java Reflection API 来 完成 的 。 在 Proxy 的 调用 过 程 中 ， 如 果 客 户 
(Client) 调 用 Proxy 的 request 方法 ， 会 在 调用 目标 对 象 的 request 方法 的 前 后 调用 一 系列 的 
处 理 ， 而 这 一 系列 的 处 理 相对 于 目标 对 象 来 说 是 透明 的 ， 目 标 对 象 对 这 些 处 理 可 以 毫 不 知 
情 ， 这 就 是 Proxy 模式 。 


13.4.2 ”相关 的 类 和 接口 


要 了 解 Java 动态 代理 的 机 制 ， 首 先 需要 了 解 以 下 相关 的 类 或 接口 。 
(1) java.lang.reflect.Proxy: 这 是 Java 动态 代理 机 制 的 主 类 ， 它 提供 了 一 组 静态 方法 
来 为 一 组 接口 动态 地 生成 代理 类 及 其 对 象 。 例 如 下 面 的 代码 演示 了 Proxy 的 静态 方法 : 
// 方法 1: 该 方法 用 于 获取 指定 代理 对 象 所 关联 的 调用 处 理 器 


static InvocationHandler getInvocationHandler (Object proxy) 
// 方法 2: 该 方法 用 于 获取 关联 于 指定 类 装载 器 和 一 组 接口 的 动态 代理 类 的 类 对 象 
static Class getProxyClass (ClassLoader loader, Class[] interfaces) 


// 方法 3: 该 方法 用 于 判断 指定 类 对 象 是 否 是 一 个 动态 代理 类 


和 六 


人 


static boolean isProxyClass (Class cl1) 


// 方法 4: 该 方法 用 于 为 指定 类 装载 器 、 一 组 接口 及 调用 处 理 器 生成 动态 代理 类 实例 
static Object newProxyInstance (ClassLoader loader, Class[] interfaces, 
InvocationHandler h) 

(2) java.lang.reflect.InvocationHandler: 这 是 调用 处 理 器 接口 ， 它 自 定义 了 一 个 invoke 
方法 ， 用 于 集中 处 理 在 动态 代理 类 对 象 上 的 方法 调用 ， 通 常 在 该 方法 中 实现 对 委托 类 的 代 
理 访问 。 例 如 下 面 的 代码 演示 InvocationHandler 的 核心 方法 : 

i a hl 第 一 个 参数 既是 代理 类 实例 ， 第 二 个 参数 是 被 调 

// 第 三 个 方法 是 调用 参数 。 调 用 处 理 器 根据 这 三 个 参数 进行 预 处 理 或 分 派 到 委托 类 实例 上 发 射 执行 
Object invoke (Object proxy, Method method, Object[] args) 

每 次 生成 动态 代理 类 对 象 时 都 需要 指定 一 个 实现 了 该 接口 的 调用 处 理 器 对 象 。 

(3) java.lang.ClassLoader: 这 是 类 装载 器 类 ， 负 责 将 类 的 字 节 码 装载 到 Java 虚拟 机 
(JVM) 中 并 为 其 定义 类 对 象 ， 然 后 该 类 才能 被 使 用 。Proxy 静态 方法 生成 动态 代理 类 同样 
需要 通过 类 装载 器 来 进行 装载 才能 使 用 ， 它 与 普通 类 的 唯一 区 别 就 是 其 字 节 码 是 由 JVM 
在 运行 时 动态 生成 的 而 非 预存 在 于 任何 一 个 .class 文件 中 。 

每 次 生成 动态 代理 类 对 象 时 都 需要 指定 一 个 类 装载 器 对 象 。 


13.4.3 ”代理 机 制 及 其 特点 


首先 让 我 们 来 了 解 一 下 如 何 使 用 Java 动态 代理 ， 具 体 有 以 下 四 步 。 

(1) 通过 实现 InvocationHandler 接口 创建 自己 的 调用 处 理 器 ; 

(2) 通过 为 Proxy 类 指定 ClassLoader 对 象 和 一 组 interface 来 创建 动态 代理 类 ; 

(3) 通过 反射 机 制 获得 动态 代理 类 的 构造 函数 ， 其 唯一 参数 类 型 是 调用 处 理 器 接口 
类 型 ; 

(4) 通过 构造 函数 创建 动态 代理 类 实例 ， 构 造 时 调用 处 理 器 对 象 作为 参数 被 传 入 。 

如 下 代码 演示 了 动态 代理 对 象 创建 过 程 : 

// InvocationHandlerImpl 实现 了 InvocationHandler 接口 ， 并 能 实现 方法 调用 从 代理 类 到 委托 

类 的 分 派 转发 

// 其 内 部 通常 包含 指向 委托 类 实例 的 引用 ， 用 于 真正 执行 分 派 转发 过 来 的 方法 调用 

InvocationHandler handler = new InvocationHandlerImpl (..); 

// 通过 Proxy 为 包括 Interface 接口 在 内 的 一 组 接口 动态 创建 代理 类 的 类 对 象 

Class clazz = Proxy.getProxyClass (classLoader, new Class[] 

{ Interface.class, ... }); 

// 通过 反射 从 生成 的 类 对 象 获得 构造 函数 对 象 

Constructor constructor = clazz.getConstructor (new Class[] 

{ InvocationHandler.class }); 


// 通过 构造 函数 对 象 创建 动态 代理 类 实例 


Interface Proxy = (Interface) constructor .newInstance (new Object[] { handler }); 
实际 使 用 过 程 更 加 简单 ， 因 为 Proxy 的 静态 方法 newProxyInstance 已 经 为 我 们 封装 
了 步骤 (2) 到 步骤 (4) 的 过 程 ， 所 以 简化 后 的 过 程 如 下 : 


// InvocationHandlerImpl 实现 了 InvocationHandler 接口 ， 并 能 实现 方法 调用 从 代理 
类 到 委托 类 的 分 派 转 发 
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InvocationHandler handler = new InvocationHandlerImpl(..); 

// 通过 Proxy 直接 创建 动态 代理 类 实例 

Interface proxy = (Interface)Proxy.newProxyInstance( classLoader, 
new Class[] { Interface.class }, 
handler ); 


接 下 来 让 我 们 来 了 解 一 下 Java 动态 代理 机 制 的 一 些 特点 。 

首先 是 动态 生成 的 代理 类 本 身 的 一 些 特点 。 

(1) 包 : 如 果 所 代理 的 接口 都 是 public 的 ， 那 么 它 将 被 定义 在 顶层 包 ( 即 包 路 径 为 
空 )， 如 果 所 代理 的 接口 中 有 非 public 的 接口 (因为 接口 不 能 被 定义 为 protect 或 private， 
所 以 除 public 之 外 就 是 默认 的 package 访问 级 别 )， 那 么 它 将 被 定义 在 该 接口 所 在 包 ( 假 
设 代理 了 com.ibm.developerworks 包 中 的 某 非 public 接口 A， 那 么 新 生成 的 代理 类 所 在 
的 包 就 是 com.ibm.developerworks)， 这 样 设计 的 目的 是 为 了 最 大 程度 的 保证 动态 代理 类 不 
会 因为 包 管 理 的 问题 而 无 法 被 成 功 定义 并 访问 ; 

(2) 类 修饰 符 : 该 代理 类 具有 final 和 public 修饰 符 ， 意味 着 它 可 以 被 所 有 的 类 访 
问 ,但 是 不 能 被 再 度 继承 ; 

(3) 类 名 : 格式 是 “$ProxyN”， 其 中 N 是 一 个 逐一 递增 的 阿拉 伯 数 字 ， 代 表 Proxy 
类 第 N 次 生成 的 动态 代理 类 ， 值 得 注意 的 一 点 是 ， 并 不 是 每 次 调用 Proxy 的 静态 方法 创 
建 动态 代理 类 都 会 使 得 N 值 增加 ， 原 因 是 如 果 对 同一 组 接口 (包括 接口 排列 的 顺序 相同 ) 试 
图 重复 创建 动态 代理 类 ， 它 会 很 聪明 地 返回 先前 已 经 创建 好 的 代理 类 的 类 对 象 ， 而 不 会 再 
尝试 去 创建 一 个 全 新 的 代理 类 ， 这 样 可 以 节省 不 必要 的 代码 重复 生成 ， 提 高 了 代理 类 的 创 


建 效率 。 
(4) 类 继承 关系 : 该 类 的 继承 关系 如 图 13-6 所 示 。 
全 ®@ OO 
> Interface AlnterfaceB, InterfaceX 


图 13-6 ”类 继承 关系 图 


由 图 13-6 可 见 ， 类 Proxy 是 它 的 父 类 ， 这 个 规则 适用 于 所 有 由 Proxy 创建 的 动态 代 
理 类 。 而 且 该 类 还 实现 了 其 所 代理 的 一 组 接口 ， 这 就 是 为 什么 它 能 够 被 安全 地 类 型 转换 到 
其 所 代理 的 某 接口 的 根本 原因 。 

接 下 来 让 我 们 了 解 一 下 代理 类 实例 的 一 些 特点 。 每 个 实例 都 会 关联 一 个 调用 处 理 器 对 
象 ， 可 以 通过 Proxy 提供 的 静态 方法 getInvocationHandler 去 获得 代理 类 实例 的 调用 处 理 
器 对 象 。 在 代理 类 实例 上 调用 其 代理 的 接口 中 所 声明 的 方法 时 ， 这 些 方法 最 终 都 会 由 调用 
处 理 器 的 invoke 方法 执行 。 此 外 ， 值 得 注意 的 是 ， 代 理 类 的 根 类 java.lang.Object 中 有 三 
个 方法 也 同样 会 被 分 派 到 调用 处 理 器 的 invoke 方法 执行 ， 它 们 是 hashCode、equals 和 
toString， 可 能 的 原因 有 : 一 是 因为 这 些 方法 为 public 且 非 final 类 型 ， 能 够 被 代理 类 覆 
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KE 
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盖 ; 二 是 因为 这 些 方法 往往 呈现 出 一 个 类 的 某 种 特征 属性 ， 具 有 一 定 的 区 分 度 ， 所 以 为 了 
保证 代理 类 与 委托 类 对 外 的 一 致 性 ， 这 三 个 方法 也 应 该 被 分 派 到 委托 类 执行 。 当 代理 的 一 
组 接口 有 重复 声明 的 方法 且 该 方法 被 调用 时 ， 代 理 类 总 是 从 排 在 最 前 面 的 接口 中 获取 方法 
对 象 并 分 派 给 调用 处 理 器 ， 而 无 论 代 理 类 实例 是 否 正 在 以 该 接口 (或 继承 于 该 接口 的 某 子 接 
口 ) 的 形式 被 外 部 引用 ， 因 为 在 代理 类 内 部 无 法 区 分 其 当前 的 被 引用 类 型 。 


13.4.4 ”应 用 动态 代理 


接着 来 了 解 一 下 被 代理 的 一 组 接口 有 哪些 特点 。 首 先 ， 要 注意 不 能 有 重复 的 接口 ， 以 
避免 动态 代理 类 代码 生成 时 的 编译 错误 。 其 次 ， 这 些 接口 对 于 类 装载 器 必须 可 见 ， 否 则 类 
装载 器 将 无 法 链接 它们 ， 将 会 导致 类 定义 失败 。 再 次 ， 需 被 代理 的 所 有 非 public 的 接口 
必须 在 同一 个 包 中 ， 否 则 代理 类 生成 也 会 失败 。 最 后 ， 接 口 的 数目 不 能 超过 65535， 这 是 
JVM 设 定 的 限制 。 

最 后 再 来 了 解 一 下 异常 处 理 方面 的 特点 。 从 调用 处 理 器 接口 声明 的 方法 中 可 以 看 到 理 
论 上 它 能 够 抛 出 任何 类 型 的 异常 ， 因 为 所 有 的 异常 都 继承 于 Throwable 接口 ， 但 事实 是 否 
如 此 呢 ? 答案 是 否定 的 ， 原 因 是 我 们 必须 遵守 一 个 继承 原则 : 即 子 类 覆盖 父 类 或 实现 父 接 
口 的 方法 时 ， 抛 出 的 异常 必须 在 原 方法 支持 的 异常 列表 之 内 。 所 以 虽然 调用 处 理 器 理论 上 
讲 能 够 ， 但 实际 上 往往 受 限 制 ， 除 非 父 接口 中 的 方法 支持 抛 Throwable 异常 。 那 么 如 果 在 
invoke 方法 中 的 确 产生 了 接口 方法 声明 中 不 支持 的 异常 ， 那 将 如 何 呢 ? 放心 ，Java 动态 
代理 类 已 经 为 我 们 设计 好 了 解决 方法 : 它 将 会 抛 出 UndeclaredThrowableException 异常 。 
此 异常 是 一 个 RuntimeException 类 型 ， 所 以 不 会 引起 编译 错误 。 通 过 该 异常 的 getCause 
方法 ， 还 可 以 获得 原来 那个 不 受 支持 的 异常 对 象 ， 以 便于 错误 诊断 。 

在 JDK 中 已 经 实现 了 这 个 Proxy 模式 ， 在 基于 Java 虚拟 机 设计 应 用 程序 时 ， 只 需要 
直接 使 用 这 个 特性 就 可 以 了 。 具 体 来 说 ， 可 以 在 Java 的 reflection 包 中 看 到 Proxy 对 象 ， 
这 个 对 象 生 成 后 ， 所 起 的 作用 就 类 似 于 Proxy 模式 中 的 Proxy 对 象 。 在 使 用 时 ， 还 需要 为 
代理 对 象 (Proxy) 设 计 一 个 回调 方法 ， 这 个 回调 方法 起 到 的 作用 是 ， 在 其 中 加 入 了 作为 代理 
需要 额外 处 理 的 动作 ， 或 者 说 ， 在 这 个 方法 中 ， 所 谓 额外 动作 ， 可 以 参考 Proxy 模式 中 的 
preOperation0 和 postOperation() 方 法 。 这 个 回调 方法 ， 如 果 在 JDK 中 实现 ， 需 要 实现 下 面 
的 InvocationHandler 接口 : 


public interface InvocationHandler { 

public Object invoke (Object proxy, Method method, Object[] args) throws 

Throwable; 

} 

在 这 个 接口 方法 中 ， 只 声明 了 一 个 invoke 方法 ， 这 个 invoke 方法 的 第 一 个 参数 是 代 
理 对 象 实例 ， 第 二 个 参数 是 Method 方法 对 象 ， 代 表 的 是 当前 Proxy 被 调用 的 方法 ， 最 后 
一 个 参数 是 被 调用 的 方法 中 的 参数 。 通 过 这 些 信 息 ， 在 invoke 方法 实现 中 ， 已 经 可 以 了 解 
Proxy 对 象 的 调用 背景 了 。 至 于 怎样 让 invoke 方法 和 Proxy 挂 上 钧 ， 熟 悉 Proxy 用 法 的 读 
者 都 知道 ， 只 要 在 实现 通过 调用 ProxynewIntance 方法 生成 具体 Proxy 对 象 时 把 
InvocationHandler 设置 到 参数 里 面 就 可 以 了 ， 剩 下 的 由 Java 虚拟 机 来 完成 。 
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如 果 读 者 研究 过 JDK 源 代码 ， 则 会 发 现在 Proxy 的 sun 实现 中 调用 了 sun.misc. 
ProxyGenerator 类 的 generateProxyClass( proxyName，interfaces) 方法 ， 其 返回 值 为 byte[] 
和 class 文件 的 内 存 类 型 一 致 。 请 看 下 面 的 演示 代码 : 


public class ProxyClassFile{ 
public static void main (String[] args){ 
String ProxyName = "TempProxy"; 
TempImpl 七 = new TempImpl ("proxy"); 
Class[] interfaces =t.getClass () .getInterfaces () 7 
byte[] proxyClassFile = ProxyGenerator.generateProxyClass( 
proxyName, interfaces); 
File f = new File("classes/TempProxy.class"); 
try { 
FileOutputstream fos = new FileOutputstream(f); 
fos.write (proxyClassFile); 
Eos Elshdy 
fos.close(); 
} catch (FileNotFoundException e) { 
e.printstackTrace(); //To change body of catch statement use 
File | Settings | File Templates. 
} catch (IOException e) { 
e.printstackTrace(); //To change body of catch statement use 
File | Settings | File Templates. 
4 
} 
} 


运行 该 类 ， 到 Class 文件 夹 下 ， 利 用 反 编译 技术 ， 发 现 原来 其 采用 了 代码 生产 技术 : 


public interface Temp{ 
public void Talk(); 
public void Run(); 
} 
import java.lang.reflect.*; 
public final class TempProxy extends Proxy 
implements Temp{ 
private static Method m4; 
private static Method m2; 
private static Method m0; 
private static Method m3; 
private static Method ml; 
public TempProxy (InvocationHandler invocationhandler) E 
super (invocationhandler); 
} 
public final void Run() { 
try { 
h.invoke (this, m4, null); 
return; 
} 
catch(Error ex) { } 
catch (Throwable throwable) { 
throw new UndeclaredThrowableException (throwable); 


后 行 js 二 


public final String tostring(){ 
trY1{ 
return (String)h.invoke (this, m2, null); 
E 
Catch (Error ex) { } 
catch (Throwable throwable) { 
throw new UndeclaredThrowableException (throwable); 
a 
Teturn 7 
} 
public final int hashCode() { 
try { 
return ((Integer)h.invoke (this, m0, null)).intvalue(); 
: 
catch(Error ex) { } 
catch (Throwable throwable){ 
throw new UndeclaredThrowableException (throwable); 
} 
return 123; 
} 
public final void Talk(){ 
tryf 
h.invoke (this, m3, null); 
return; 
} 
catch(Error ex) { } 
catch (Throwable throwable) { 
throw new UndeclaredThrowableException (throwable); 
2 


} 
public final boolean equals (Object obj) { 


Ey 
return ((Boolean)h.invoke (this, ml, new Object[] { 
Obj 
})) .booleanValue (); 
} 
Catch (Error ex) { } 
catch (Throwable throwable) { 
throw new UndeclaredThrowableException (throwable); 
1 
return false; 
} 
statict{ 


tryt{ 
m4 = Class.forName ("Temp") .getMethod ("Run", new Class[0]); 


m2 = Class.forName ("java.1lang.Object") .getMethod ("tostring", new Class[0]); 
m0 = Class.forName ("java.lang.Object") .getMethod ("hashCode", new Class[0]); 
m3 = Class.forName ("Temp") .getMethod ("Talk", new Class[0]); 

ml = Class.forName ("java.lang.Object") .getMethod ("equals", new 


Class[] { 


Class.forName ("java.lang.Object") 


DD); 


ii 
catch (NoSuchMethodException nosuchmethodexception) { 
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NoSuchMethodError (nosuchmethodexception.getMessage ()); 
1 


catch (ClassNotFoundException classnotfoundexception) { 
throw new 


NoClassDefFoundError (classnotfoundexception.getMessage ()); 
F 


} 
} 


一 个 动态 代理 必须 要 有 的 4 个 类 : 一 个 接口 、 一 个 实现 了 该 接口 的 类 、 一 个 实现 


InvocationHandler 接口 的 类 和 写 一 个 有 main 方法 的 测试 类 。 这 里 需要 重点 说 的 是 ， 实 现 了 
InvocationHandler 接口 的 类 ， 在 InvocationHandler 接口 里 有 且 只 有 一 个 方法 : invoke0， 真 
正 的 代理 是 由 此 方法 来 实现 的 。 它 需要 三 个 参数 : 要 代理 的 类 、 要 代理 的 方法 ， 以 及 方法 
的 参数 。 所 以 实现 了 InvoactionHandler 接口 的 类 必须 实现 invoke() 这 个 方法 ， 在 这 个 方法 
里 我 们 可 以 利用 反射 的 原理 调用 指定 类 的 具有 指定 参数 的 方法 ， 也 就 是 实现 代理 。 


import java.lang.reflect.InvocationHandler; 

import java.lang.reflect.Method; 

import java.util.logging.Logger; 

public class LogHandler implements InvocationHandler 

{ 

private Logger log=Logger.getLogger (this.getClass() .getName ()); 
private Object delegate; 

public LogHandler (Object delegate) 

{ 

this.delegate=delegate; 

} 

public Object invoke (Object proxy,Method method,Object[] args) throws 
Throwable 

{ 

Object obj=null; 


Eey 

{ 
log.info("method stats...."+method); 
obj=method.invoke (delegate,args); 
log.info ("method end...."+method); 


} 

catch (Exception e) 

{ 

log.info("Exception happends...."); 

} 

return obj; 

} 
} 


另外 一 个 需要 说 的 就 是 有 main( 方 法 的 测试 类 ， 在 这 个 main() 方 法 里 我 们 需要 用 真实 
类 创建 一 个 对 象 ， 并 以 此 对 象 为 参数 实例 化 一 个 InvocationHandler( 参 考 jdk1.5 中 的 写法 


InvocationHandler handler = new MyInvocationHandler(.…))， 最 核心 的 一 步 就 是 用 Proxy 类 得 
到 一 个 接口 类 的 代理 类 ， 我 们 可 以 参考 jdk1.5 中 的 写法 : 


Foo f = (Foo) Proxy.newProxyInstance (Foo.class.getClassLoader(),new 
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handler); 


其 中 Foo 是 原始 类 ， 即 被 代理 的 类 ， 用 这 个 代理 类 来 调用 原始 类 中 的 方法 ， 它 是 通过 
invoke() 方 法 实现 的 ， 至 此 我 们 就 完成 了 动态 代理 。 测 试 类 程序 清单 如 下 : 

import java.lang.reflect.InvocationHandler; 

import java.lang.reflect.Proxy; 


public class BusinessObject 
{ 


public static void main (String args[]) 
' 
Bussob]j businessImp=new BussObj (); 
InvocationHandler handler=new LogHandler (businessImp); 
Business 
business=(Business)Proxy.newProxyInstance (Business.class.getClassLoader( 
) ,businessImp.getClass () .getInterfaces(),handler); 
business.getstring(); 
} 


} 


其 中 Business 是 接口 ，BussObj 类 是 实现 了 Business 接口 的 类 ， 这 两 个 类 中 的 代码 需 
要 读者 自己 去 写 。 上 述 测试 程序 运行 结果 如 图 13-7 所 示 。 


java Busin bject 
Handler invoke 
.public ract void Business.getStringC) 


9-3 17:21:58 LogHandler invoke 


method end....public abstract void Busi .getStringC) 


图 13-7 ”执行 效果 
在 使 用 代理 时 ， 首 先 记 住 如 下 Proxy 的 几 个 重要 的 静态 变量 : 
// 映射 表 : 用 于 维护 类 装载 器 对 象 到 其 对 应 的 代理 类 缓存 


private static Map loaderToCache = new WeakHashMap (); 

// 标记 : 用 于 标记 一 个 动态 代理 类 正在 被 创建 中 

private static Object pendingGenerationMarker = new Object(); 

// 同步 表 : 记录 已 经 被 创建 的 动态 代理 类 类 型 ， 主 要 被 方法 isProxyclass 进行 相关 的 判断 
private static Map proxyClasses = Collections.synchronizedMap (new 
WeakHashMap ()); 

// 关联 的 调用 处 理 器 引用 


protected InvocationHandler h; 
然后 看 一 下 Proxy 的 构造 方法 : 


// 由 于 Proxy 内 部 从 不 直接 调用 构造 函数 ， 所 以 private 类 型 意味 着 禁止 任何 调用 
private Proxy() {} 


// 由 于 Proxy 内 部 从 不 直接 调用 构造 函数 ， 所 以 protected 意味 着 只 有 子 类 可 以 调用 
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protected Proxy (InvocationHandler h) {this.h = h;} 
接着 可 以 快速 浏览 newProxyInstance 方法 : 
public static Object newProxyInstance (ClassLoader loader, 
Class<?>[] interfaces, 
InvocationHandler h) 
throws IllegalArgumentException { 


// 检查 h 不 为 空 ， 否 则 抛 异 常 
if (h == null) { 

throw new NullPointerException(); 
} 


// 获得 与 制定 类 装载 器 和 一 组 接口 相关 的 代理 类 类 型 对 象 


Class cl = getProxyClass (loader, interfaces); 


// 通过 反射 获取 构造 函数 对 象 并 生成 代理 类 实例 
try { 
Constructor cons = cl.getConstructor(constructorParams); 
return (Object) cons .newInstance (new Object[] { h }); 
} catch (NoSuchMethodException e) { throw new 
InternalError (e.tostring()); 
} catch (IllegalAccessException e) { throw new 
InternalError (e.tostring()); 
} catch (InstantiationException e) { throw new 
InternalError (e.tostring()); 
} catch (InvocationTargetException e) { throw new 
InternalError (e.tostring()); 
} 
} 


由 此 可 见 ， 动 态 代理 真正 的 关键 是 在 getProxyClass 方法 ， 该 方法 负责 为 一 组 接口 动 
态 地 生成 代理 类 类 型 对 象 。 在 该 方法 内 部 ， 您 将 能 看 到 Proxy 内 的 各 路 英雄 (静态 变量 ) 悉 
数 登场 。 有 点 迫不及待 了 么 ? 那 就 让 我 们 一 起 走 进 Proxy 最 最 神秘 的 殿堂 去 欣赏 一 番 吧 。 
该 方法 总 共 可 以 分 为 四 步 。 

(1) 对 这 组 接口 进行 一 定 程度 的 安全 检查 ， 包 括 检查 接口 类 对 象 是 否 对 类 装载 器 可 见 
并 且 与 类 装载 器 所 能 识别 的 接口 类 对 象 是 完全 相同 的 ， 还 会 检查 确保 是 interface 类 型 而 
不 是 class 类 型 。 这 个 步骤 通过 一 个 循环 来 完成 ， 检 查 通过 后 将 会 得 到 一 个 包含 所 有 接口 
名 称 的 字符 串 数组 ， 记 为 String[] interfaceNames。 总 体 上 这 部 分 实现 比较 直观 ， 所 以 略 去 
大 部 分 代码 ， 仅 保留 如 何 判断 某 类 或 接口 是 否 对 特定 类 装载 器 可 见 的 相关 代码 。 例 如 在 下 
面 的 代码 中 ， 通 过 方法 Class.forName 判断 了 接口 的 可 见 性 。 


es 
// 指定 接口 名 字 、 类 装载 器 对 象 ， 同 时 制定 initializeBoolean 为 false 表示 无 


类 
// 如 果 方 法 返回 正常 这 表示 可 见 ， 否 则 会 抛 出 ClassNotFoundException 异常 表示 
不 可 见 
interfaceClass = Class.forName (interfaceName, false, loader); 
} catch (ClassNotFoundException e) { 
} 


(2) 从 loaderToCache 映射 表 中 获取 以 类 装载 器 对 象 为 关键 字 所 对 应 的 缓存 表 ， 如 果 


不 存在 就 创建 一 个 新 的 缓存 表 并 更 新 到 loaderToCache。 缓 存 表 是 一 个 HashMap 实例 ， 
正常 情况 下 它 将 存放 键 值 对 (接口 名 字 列 表 ， 动 态 生 成 的 代理 类 的 类 对 象 引 用 )。 当 代理 类 
正在 被 创建 时 它 会 临时 保存 (接口 名 字 列 表 ，pendingGenerationMarker)。 标 记 
pendingGenerationMarke 的 作用 是 通知 后 续 的 同类 请 求 (接口 数组 相同 且 组 内 接口 排列 顺序 
也 相同 ) 代 理 类 正在 被 创建 ， 请 保持 等 待 直 至 创建 完成 。 下 面 的 代码 演示 了 缓存 表 的 使 用 。 


do { 
// 以 接口 名 字 列表 作为 关键 字 获 得 对 应 cache 值 
Object value = cache.get (key); 
if (value instanceof Reference) { 
proxyClass = (Class) ((Reference) value) .get (); 
} 
if (proxyClass != null) { 
// 如 果 已 经 创建 ， 直 接 返 回 


return proxyClass; 


} else if (value == pendingGenerationMarker) { 
// 代理 类 正在 被 创建 ， 保 持 等 待 
try { 


cache.wait (); 
} catch (InterruptedException e) { 


} 
// 等 待 被 唤醒 ， 继 续 循环 并 通过 二 次 检查 以 确保 创建 完成 ， 否 则 重新 等 待 
continue; 
} else { 
// 标记 代理 类 正在 被 创建 
cache.put (key, pendingGenerationMarker); 
// break 跳出 循环 已 进入 创建 过 程 
break; 
} while (true); 


(3) 动态 创建 代理 类 的 类 对 象 。 首 先是 确定 代理 类 所 在 的 包 ， 其 原则 如 前 所 述 ， 如 果 
都 为 public 接口 ， 则 包 名 为 空 字符 串 表 示 顶 层 包 ， 如 果 所 有 非 public 接口 都 在 同一 个 
包 ， 则 包 名 与 这 些 接口 的 包 名 相同 ; 如 果 有 多 个 非 public 接口 且 不 同 包 ， 则 抛 异常 终止 
代理 类 的 生成 。 确 定 了 包 后 ， 就 开始 生成 代理 类 的 类 名 ， 同 样 如 前 所 述 按 格 式 
“SProxyN” 生 成 。 例 如 下 面 的 代码 动态 生成 了 代理 类 。 

// 动态 地 生成 代理 类 的 字 节 码 数组 
byte[] proxyClassFile = ProxyGenerator.generateProxyClass( proxyName, 
interfaces); 
try { 
// 动态 地 定义 新 生成 的 代理 类 
proxyClass = defineClass0 (loader, proxyName, proxyClassFile, 0, 
proxyClassFile.length); 


} catch (ClassFormatError e) { 
throw new IllegalArgumentException(e.tostring()); 


[i 
// 把 生成 的 代理 类 的 类 对 象 记录 进 prozxyclasses 表 


proxyClasses.put (proxyClass, null); 


由 此 可 见 ， 所 有 代码 生成 的 工作 都 由 神秘 的 ProxyGenerator 完成 了 ， 当 你 尝试 去 探索 
这 个 类 时 ， 你 所 能 获得 的 信息 仅仅 是 它 位 于 并 未 公开 的 sunmisc 包 ， 有 若干 常量 、 变 量 
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和 方法 以 完成 这 个 神奇 的 代码 生成 的 过 程 ， 但 是 sun 并 没有 提供 源 代 码 以 供 研 读 。 至 于 动 
态 类 的 定义 ， 则 由 Proxy 的 native 静态 方法 defineClass0 执行 。 

(4) 代码 生成 过 程 进入 结尾 部 分 ， 根 据 结果 更 新 缓存 表 ， 如 果 成 功 则 将 代理 类 的 类 对 
象 引 用 更 新 进 缓存 表 ， 否 则 清除 缓存 表 中 对 应 的 关键 值 ， 最 后 唤醒 所 有 可 能 的 正在 等 待 
的 线程 。 

经 过 以 上 四 步 后 ， 所 有 的 代理 类 生成 细节 都 已 介绍 完毕 ， 剩 下 的 静态 方法 如 
getInvocationHandler 和 isProxyClass 就 显得 如 此 的 直观 ， 只 需 通过 查询 相关 变量 就 可 以 
完成 ， 所 以 对 其 的 代码 分 析 就 省 略 了 。 

分 析 了 类 Proxy 的 源 代码 之 后 ， 相 信 在 读者 的 脑海 中 会 对 Java 动态 代理 机 制 形成 一 个 
更 加 清晰 的 理解 ， 但 是 当 探 索 之 旅 在 sun.misc.ProxyGenerator 类 处 夏 然而 止 ， 所 有 的 神秘 
都 汇聚 于 此 时 ， 相 信 不 少 读者 也 会 对 这 个 ProxyGenerator 类 产生 有 类 似 的 疑惑 : 它 到 底 做 
了 什么 呢 ? 它 是 如 何 生成 动态 代理 类 的 代码 的 呢 ? 在 此 也 无 法 给 出 确切 的 答案 。 还 是 让 我 
们 带 着 这 些 疑惑 ， 一 起 开始 探索 之 旅 吧 。 

事物 往往 不 像 其 看 起 来 的 复杂 ， 需 要 的 是 我 们 能 够 化 繁 为 简 ， 这 样 也 许 就 能 有 更 多 拨 
云 见 日 的 机 会 。 抛 开 所 有 想象 中 的 未 知 而 复杂 的 神秘 因素 ， 如 果 让 我 们 用 最 简单 的 方法 去 
实现 一 个 代理 类 ， 唯 一 的 要 求 是 同样 结合 调用 处 理 器 实施 方法 的 分 派 转发 ， 您 的 第 一 反应 
将 是 什么 呢 ? “ 听 起 来 似乎 并 不 是 很 复杂 ”的 确 ， 拘 指 算 算 所 涉及 的 工作 无 非 包括 几 个 反 
射 调用 ， 以 及 对 原始 类 型 数据 的 装 箱 或 拆 箱 过 程 ， 其 他 的 似乎 都 已 经 水 到 渠 成 。 非 常 的 
好 ， 让 我 们 整理 一 下 思绪 ， 一 起 来 完成 一 次 完整 的 推演 过 程 吧 。 

例如 通过 下 面 的 代码 ， 演 示 代 理 类 中 的 方法 调用 的 分 派 转发 的 推演 实现 过 程 。 

// 假设 需 代 理 接口 Simulator 


public interface Simulator { 
short simulate (int argl, long arg2, String arg3) throws ExceptionA, 
ExceptionB; 


下 
// 假设 代理 类 为 SimulatorProxy， 其 类 声明 将 如 下 
final public class SimulatorProxy implements Simulator { 
// 调用 处 理 器 对 象 的 引用 
protected InvocationHandler handler; 
// 以 调用 处 理 器 为 参数 的 构造 函数 
public SimulatorProxy (InvocationHandler handler){ 
this.handler = handler; 


} 
// 实现 接口 方法 simulate 
public short simulate (int argl, long arg2, String arg3) 
throws ExceptionA, ExceptionB { 
// 第 一 步 是 获取 simulate 方法 的 Method 对 象 
java.lang.reflect.Method method = null; 
trY{ 
method = Simulator.class.getMethod ( 
"simulate", 
new Class[] {int.class, long.class, String.class} ); 
} catch (Exception e) { 


// 异常 处 理 1 ( 略 ) 
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// 第 二 步 是 调用 handler 的 invoke 方法 分 派 转发 方法 调用 
Object = null; 
志 安 于 
r= handler.invoke (this, 
method, 
// 对 于 原始 类 型 参数 需要 进行 装 箱 操作 
new Object[] {new Integer(argl), new Long(arg2), arg3}); 
}catch (Throwable e) { 
// 异常 处 理 2 ( 略 ) 


} 
// 第 三 步 是 返回 结果 (返回 类 型 是 原始 类 型 则 需要 进行 拆 箱 操作 ) 


return ((Short)r).shortValue(); 


i 

} 

模拟 推演 为 了 突出 通用 逻辑 所 以 更 多 地 关注 正常 流程 ， 而 淡化 了 错误 处 理 ， 但 在 实际 
中 错误 处 理 同 样 非常 重要 。 从 以 上 的 推演 中 我 们 可 以 得 出 一 个 非常 通用 的 结构 化 流程 : 第 
一 步 从 代理 接口 获取 被 调用 的 方法 对 象 ， 第 二 步 分 派 方法 到 调用 处 理 器 执行 ， 第 三 步 返回 
结果 。 在 这 之 中 ， 所 有 的 信息 都 是 可 以 已 知 的 ， 比 如 接口 名 、 方 法 名 、 参 数 类 型 、 返 回 类 
型 以 及 所 需 的 装 箱 和 拆 箱 操作 ， 那 么 既然 我 们 手工 编写 是 如 此 ， 那 又 有 什么 理由 不 相信 
ProxyGenerator 不 会 做 类 似 的 实现 呢 ? 至 少 这 是 一 种 比较 可 能 的 实现 。 

接 下 来 让 我 们 把 注意 力 重 新 回 到 先前 被 淡化 的 错误 处 理 上 来 。 在 异常 处 理 1 处 ， 由 于 
我 们 有 理由 确保 所 有 的 信息 如 接口 名 、 方 法 名 和 参数 类 型 都 准确 无 误 ， 所 以 这 部 分 异常 发 
生 的 概率 基本 为 零 ， 所 以 基本 可 以 忽略 。 而 异常 处 理 2 处 ， 我 们 需要 思考 得 更 多 一 些 。 
回想 一 下 ， 接 口 方法 可 能 声明 支持 一 个 异常 列表 ， 而 调用 处 理 器 invoke 方法 又 可 能 抛 出 
与 接口 方法 不 支持 的 异常 ， 再 回想 一 下 先前 提 及 的 Java 动态 代理 的 关于 异常 处 理 的 特 
点 ， 对 于 不 支持 的 异常 ， 必 须 抛 UndeclaredThrowableException 运行 时 异常 。 所 以 通过 再 
次 推演 ， 我 们 可 以 得 出 一 个 更 加 清晰 的 异常 处 理 2 的 情况 ， 下 面 是 细 化 的 异常 处 理 2 的 演 


示 代 码 。 
Object r = null; 
try { 
r= handler.invoke (this, 


method, 
new Object[] {new Integer(argl), new Long(arg2), arg3}); 
} catch( ExceptionA e) { 
// 接口 方法 支持 ExceptionA， 可 以 抛 出 
throw e; 
} catch( ExceptionB e ) { 
// 接口 方法 支持 ExceptionB， 可 以 抛 出 
throw e; 
} catch (Throwable e) { 
// 其 他 不 支持 的 异常 ， 一 律 抛 UndeclaredThrowableException 
throw new UndeclaredThrowableException (e); 
| 


这 样 我 们 就 完成 了 对 动态 代理 类 的 推演 实现 。 推 演 实现 遵循 了 一 个 相对 固定 的 模式 ， 
可 以 适用 于 任意 定义 的 任何 接口 ， 而 且 代码 生成 所 需 的 信息 都 是 可 知 的 ， 那 么 有 理由 相信 
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即使 是 机 器 自动 编写 的 代码 也 有 可 能 延续 这 样 的 风格 ， 至 少 可 以 保证 这 是 可 行 的 。 

注意 : Proxy 已 经 设计 得 非常 优美 了 ， 但 是 还 是 有 一 点 点 小 小 的 遗憾 ， 那 就 是 它 始终 
无 法 摆脱 仅 支 持 interface 代理 的 梭 格 ， 因 为 它 的 设计 注定 了 这 个 遗憾 。 在 动态 生成 的 代 
理 类 的 继承 关系 中 ， 它 们 已 经 注定 有 一 个 共同 的 父 类 叫 Proxy。Java 的 继承 机 制 注定 了 这 
些 动态 代理 类 们 无 法 实现 对 Class 的 动态 代理 ， 原 因 是 多 继承 在 Java 中 本 质 上 就 行 不 
通 。 有 很 多 条 理由 ， 人 们 可 以 否定 对 Class 代理 的 必要 性 ， 但 是 同样 有 一 些 理由 ， 相 信 支 
持 Class 动态 代理 会 更 美好 。 接 口 和 类 的 划分 ， 本 就 不 是 很 明显 ， 只 是 到 了 Java 中 才 变 
得 如 此 的 细 化 。 如 果 只 从 方法 的 声明 及 是 否 被 定义 来 考量 ， 有 一 种 两 者 的 混合 体 ， 它 的 名 
字 叫 抽象 类 。 实 现 对 抽象 类 的 动态 代理 ， 相 信也 有 其 内 在 的 价值 。 此 外 ， 还 有 一 些 历史 遗 
留 的 类 ， 它 们 将 因为 没有 实现 任何 接口 而 从 此 与 动态 代理 永世 无 缘 。 如 此 种 种 ， 不 得 不 说 
是 一 个 小 小 的 遗憾 。 
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编译 优化 


优化 是 指 为 了 更 加 优秀 ， 目 的 是 “去 其 糟粕 ， 取 其 精华 ”， 是 一 项 使 某 人 
/ 某 物 变 得 更 优秀 的 方法 /技术 。 从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 追逐 
就 是 程序 天 生 的 坚定 信仰 ， 这 个 过 程 犹如 一 场 没有 终点 、 永 不 停 歌 的 Fl 方程 式 
赛车 ， 程 序 员 是 车 手 ， 技 术 平台 则 是 在 赛 道上 飞驰 的 赛车 。 本 章 将 详细 讲解 
JVM 在 编译 时 期 的 优化 技术 方案 。 


he 


14.1 Java 的 编译 过 程 


Java 编译 程序 能 够 将 Java 源 程 序 编译 成 JVM 可 执行 代码 一 一 Java 字 节 码 。Java 在 编 
译 过 程 中 一 般 会 按照 以 下 过 程 进行 。 

(1) JDK 根据 编译 参数 encoding 确定 源 代 码 字 符 集 。 如 果 不 指 定 该 参数 ， 系 统 会 根据 
操作 系统 的 file.encoding 参数 来 获取 操作 系统 编码 格式 ， 国 内 的 Windows 通常 都 是 
GBK。 

(2) JDK 根据 上 面 的 字符 集 信息 ， 将 源 文 件 编译 成 JAVA 内 部 的 unicode 模式 ， 并 将 
编译 后 的 内 容 保存 到 内 存 中 。 

(3) JDK 将 内 存 保存 完好 的 内 存 信 息 写 入 .class 文件 ， 生 成 最 后 的 二 进 制 文件 。 

很 多 人 会 发 现 自己 在 IDE 中 配置 了 源 文件 字符 集 为 UTF-8( 与 操作 系统 默认 字符 集 不 
同 ) 后 ， 再 直接 运行 javac 就 会 出 现 错误 ， 这 就 是 因为 不 加 encoding 参数 的 编译 过 程 中 会 默 
认 使 用 系统 的 字符 集 的 。 在 Windows 中 默认 为 GBK。IDE 中 进行 编译 时 ，IDE 会 在 编译 
参数 中 增加 该 参数 。 

如 果 使 用 Ant 来 进行 编译 活动 ， 那 么 需要 确认 源 代码 的 字符 集 ， 然 后 再 相应 的 Ant 编 
译 任 务 中 ， 增 加 encoding 参数 就 意味 着 ， 如 果 之 前 的 项 目 采 用 的 是 系统 默认 的 字符 集 
(GBK) 来 编辑 的 源 代码 ， 那 么 如 果 改 用 UTF-8， 就 意味 需要 重新 修改 Ant 脚本 ， 重 新 打包 
我 们 的 产品 。 

Java 编译 器 却 不 将 对 变量 和 方法 的 引用 编译 为 数值 引用 ， 也 不 确定 程序 执行 过 程 中 的 
内 存 布局 ， 而 是 将 些 符 号 引用 信息 保留 在 字 节 码 中 ， 由 解释 器 在 运行 过 程 中 创立 内 存 布 
局 ， 然 后 再 通过 查 表 来 确定 一 个 方法 所 在 的 地 址 ， 这 样 就 有 效 地 保证 了 Java 的 可 移植 性 和 
安全 性 。 

运行 JVM 字符 码 的 工作 是 由 解释 器 来 完成 的 。 解 释 执行 过 程 分 三 步 进行 ， 代码 的 装 
入 、 代 码 的 校 验 、 和 代码 的 执行 。 

装 入 代码 的 工作 由 “类 装载 器 classloader” 完 成 。 类 装载 器 负责 装 入 运行 一 个 程序 需 
要 的 所 有 代码 ， 这 也 包括 程序 代码 中 的 类 所 继承 的 类 和 被 调用 的 类 。 当 类 装载 器 装 入 一 个 
类 时 ， 该 类 被 放 在 自己 的 名 字 空间 中 。 除 了 通过 符号 引用 自己 名 字 空 间 以 外 的 类 ， 类 之 间 
没有 其 他 办 法 可 以 影响 其 他 类 。 在 本 台 计 算 机 的 所 有 类 都 在 同一 地 址 空间 中 ， 而 所 有 从 外 
部 引进 的 类 ， 都 有 一 个 自己 独立 的 名 字 空间 。 这 使 得 本 地 类 通过 共享 相同 的 名 字 空 间 获 得 
较 高 的 运行 效率 ， 同 时 又 保证 它们 与 从 外 部 引进 的 类 不 会 相互 影响 。 

当 装 入 了 运行 程序 需要 的 所 有 类 后 ， 解 释 器 便 可 确定 整个 可 执行 程序 的 内 存 布局 。 解 
释 器 为 符号 引用 与 特定 的 地 址 空间 建立 对 应 关系 及 查询 表 。 通 过 在 这 一 阶段 确定 代码 的 内 
布局 ，Java 很 好 地 解决 了 由 超 类 改变 而 使 子 类 崩溃 的 问题 ， 同 时 也 防止 了 代码 的 非法 
访问 。 

随后 ， 被 装 入 的 代码 由 字 节 码 校 验 器 进行 检查 。 校 验 器 可 以 发 现 操 作 数 栈 溢出 、 非 法 
数据 类 型 转化 等 多 种 错误 。 通 过 校 验 后 ， 代 码 便 开始 执行 了 。 
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有 如 下 两 种 执行 Java 字 节 码 的 方式 : 

(1) 即时 编译 方式 : 解释 器 先 将 字 节 编译 成 机 器 码 ， 然 后 再 执行 该 机 器 码 。 

(2) 解释 执行 方式 ;解释 器 通过 每 次 解释 并 执行 一 小 段 代 码 来 完成 Java 字 节 码 程序 的 
所 有 操作 。 


14.2 ”Java 编译 优化 简介 


Java 应 用 程序 的 编译 过 程 与 静态 编译 语言 (例如 C 或 C++) 不 同 。 静 态 编译 器 直接 把 源 
代码 转换 成 可 以 直接 在 目标 平台 上 执行 的 机 器 代码 ， 不 同 的 硬件 平台 要 求 不 同 的 编译 器 。 
Java 编译 器 把 Java 源 代码 转换 成 可 移植 的 JVM 字 节 码 。 我 们 在 写 代码 时 ， 常 常会 提 到 如 
下 两 条 原则 : 

(1) 方法 要 尽量 短 ， 大 方法 要 分 解 成 小 方法 ; 

(2) 不 要 重复 发 明 轮 子 。 

我 们 在 强调 这 两 个 原则 的 时 候 ， 往 往 只 关注 的 是 代码 简洁 、 易 维护 等 方便 我 们 的 因 
素 ， 其 实 这 样 做 还 可 以 大 大 方便 Java 编译 器 优化 代码 。 

Java 应 用 程序 的 编译 过 程 与 静态 编译 语言 (例如 C 或 C++ 不同。 静态 编译 器 直接 把 源 
代码 转换 成 可 以 直接 在 目标 平台 上 执行 的 机 器 代码 ， 不 同 的 硬件 平台 要 求 不 同 的 编译 器 。 
Java 编译 器 把 Java 源 代码 转换 成 可 移植 的 JVM 字 节 码 。 与 静态 编译 器 不 同 ，Javac 几乎 不 
做 什么 优化 ， 在 静态 编译 语言 中 应 当 由 编译 器 进行 的 优化 工作 ， 在 Java 中 是 在 程序 执行 的 
时 候 ， 由 运行 时 执行 优化 。 

1. 即时 编译 


对 于 证 实 概念 的 实现 来 说 ， 解 释 是 合适 的 ， 但 是 早期 的 JVM 由 于 太 慢 。 下 一 代 JVM 
使 用 即时 (IT) 编 译 器 来 提高 执行 速度 。 按 照 严 格 的 定义 ， 基 于 JIT 的 虚拟 机 在 执行 之 前 ， 
把 所 有 字 节 码 转换 成 机 器 码 ， 但 是 以 惰性 方式 来 做 这 项 工作 : JIT 只 有 在 确定 某 个 代码 路 
径 将 要 执行 的 时 候 ， 才 编译 这 个 代码 路 径 ( 因 此 有 了 “即时 编译 ”的 名 称 )。 这 个 技术 使 程 
序 能 启动 得 更 快 ， 因 为 在 开始 执行 之 前 ， 不 需要 元 长 的 编译 阶段 。 

JIT 技术 看 起 来 很 有 前 途 ， 但 是 它 有 一 些 不 足 。JIT 消除 了 解释 的 负担 (以 额外 的 启动 
成 本 为 代价 )， 但 是 由 于 若干 原因 ， 代 码 的 优化 等 级 仍然 很 一 般 。 为 了 避免 Java 应 用 程序 
严重 的 启动 延迟 ，JIT 编译 器 必须 非常 迅速 ， 这 意味 着 它 无 法 把 大 量 时 间 花 在 优化 上 。 所 
以 ， 早 期 的 JIT 编译 器 在 进行 内 联 假设 (Inliningassumption) 方 面 比较 保守 ， 因 为 它们 不 知道 
后 面 可 能 要 装 入 哪个 类 。 

虽然 从 技术 上 讲 ， 基 于 JIT 的 虚拟 机 在 执行 字 节 码 之 前 ， 要 先 编译 字 节 码 ， 但 是 JIT 
这 个 术语 通常 被 用 来 表示 任何 把 字 节 码 转换 成 机 器 码 的 动态 编译 过 程 一 一 即使 那些 能 够 解 
释 字 节 码 的 过 程 也 算 。 


2. HotSpot 动态 编译 
HotSpot 执行 过 程 组 合 了 编译 、 性 能 分 析 以 及 动态 编译 。 它 没有 把 所 有 要 执行 的 字 节 
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码 转换 成 机 器 码 ， 而 是 先 以 解释 器 的 方式 运行 ， 只 编译 “热门 ”代码 一 一 执行 得 最 频繁 的 
代码 。 当 HotSpot 执行 时 ， 会 搜集 性 能 分 析 数 据 ， 用 来 决定 哪个 代码 段 执行 得 足够 频繁 ， 
值得 编译 。 只 编译 执行 最 频繁 的 代码 有 几 项 性 能 优势 : 没有 把 时 间 浪 费 在 编译 那些 不 经 常 
执行 的 代码 上 ; 这 样 ， 编 译 器 就 可 以 花 更 多 时 间 来 优化 热门 代码 路 径 ， 因 为 它 知道 在 这 上 
面 花 的 时 间 物 有 所 值 。 而 且 ， 通 过 延迟 编译 ， 编 译 器 可 以 访问 性 能 分 析 数据 ， 并 用 这 些 数 
据 来 改进 优化 决策 ， 例 如 是 否 需要 内 联 某 个 方法 调用 。 

为 了 让 事情 变 得 更 复杂 ，HotSpot 提供 了 两 个 Java 编译 器 : 客户 机 编译 器 和 服务 器 编 
译 器 。 默 认 采 用 客户 机 编译 器 ， 在 启动 JVM 时 ， 您 可 以 指定 -server 开关 ， 选 择 服务 器 编 
译 器 。 服 务 器 编译 器 针对 最 大 峰值 操作 速度 进行 了 优化 ， 适 用 于 需要 长 期 运行 的 服务 器 应 
用 程序 。 客 户 机 编译 器 的 优化 目标 ， 是 减少 应 用 程序 的 启动 时 间 和 内 存 消耗 ， 优 化 的 复杂 
程度 远 远 低 于 服务 器 编译 器 ， 因 此 需要 的 编译 时 间 也 更 少 。 

HotSpot 服务 器 编译 器 能 够 执行 各 种 各 样 的 类 。 它 能 够 执行 许多 静态 编译 器 中 常见 的 
标准 优化 ， 例 如 代码 提升 (Hoisting)、 公 共 的 子 表达 式 清除 、 循 环 展开 (Unrolling)、 范 围 检 
测 清除 、 死 代码 清除 、 数 据 流 分 析 ， 还 有 各 种 在 静态 编译 语言 中 不 实用 的 优化 技术 ， 例 如 
虚 方 法 调用 的 聚合 内 联 。 

3. 持续 重新 编译 


HotSpot 技术 另 一 个 有 趣 的 方面 是 : 编译 不 是 一 个 全 有 或 者 全 无 (All-or-Nothing) 的 命 
题 。 在 解释 代码 路 径 一 定 次 数 之 后 ， 会 把 它 重 新 编译 成 机 器 码 。 但 是 JVM 会 继续 进行 性 
能 分 析 ， 而 且 如 果 认 为 代码 路 径 特别 热门 ， 或 者 未 来 的 性 能 分 析 数 据 认为 存在 额外 的 优化 
可 能 ， 那 么 还 有 可 能 用 更 高 一 级 的 优化 重新 编译 代码 。JVM 在 一 个 应 用 程序 的 执行 过 程 
中 ， 可 能 会 把 相同 的 字 节 码 重 新 编译 许多 次 。 为 了 深入 了 解 编译 器 做 了 什么 ， 可 以 - 
XX:+PrintCompilation 标志 调用 JVM， 这 个 标志 会 使 编译 器 (客户 机 或 服务 器 ) 每 次 运行 的 时 
候 打 印 一 条 短 消息 。 

4. 栈 上 (On-stack) 替 换 


HotSpot 开始 的 版 本 编译 的 时 候 每 次 编译 一 个 方法 。 如 果 某 个 方法 的 累计 执行 次 数 超 
过 指定 的 循环 欠 代 次 数 (在 HotSpot 的 第 一 版 中 ， 是 10 000 次 )， 那 么 这 个 方法 就 被 当 作 热 
门 方法 ， 计 算 的 方式 是 : 为 每 个 方法 关联 一 个 计数 器 ， 每 次 执行 一 个 后 向 分 支 时 ， 就 会 递 
增 计 数 器 一 次 。 但 是 ， 在 方法 编译 之 后 ， 方 法 调用 并 没有 切换 到 编译 的 版 本 ， 需 要 退出 并 
重新 进入 方法 ， 后 续 调 用 才 会 使 用 编译 的 版 本 。 结 果 就 是 ， 在 某 些 情 况 下 ， 可 能 永远 不 会 
用 到 编译 的 版 本 ， 例 如 对 于 计算 密集 型 程序 ， 在 这 类 程序 中 所 有 的 计算 都 是 在 方法 的 一 次 
调用 中 完成 的 。 重 量 级 方法 可 能 被 编译 ， 但 是 编译 的 代码 永远 用 不 到 。 

HotSpot 最 近 的 版 本 采用 了 称 为 栈 上 (On-stack) 蔡 换 (OSR) 的 技术 ， 支 持 在 循环 过 程 中 
间 ， 从 解释 执行 切换 到 编译 的 代码 (或 者 从 编译 代码 的 一 个 版 本 切换 到 另 一 个 版 本 )。 

从 Java 编译 、 执 行 优化 的 原理 可 以 看 出 ， 编 译 器 会 将 “热门 代码 块 ”、“ 热 门 方法 ” 
持续 优化 ， 以 提高 性 能 ， 再 回顾 我 们 常常 强调 的 两 个 原则 。 

(1) 尽量 写 小 方法 。 小 方法 意味 着 功能 单一 、 重 用 性 高 ， 自 然 会 被 很 多 地 方 用 到 ， 容 
易 变 成 “热门 方法 ”。 
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(2) 不 重复 发 明 轮子 ， 尽 量 用 已 存在 的 轮子 。 大 家 共用 一 个 “轮子 ”， 自 然 就 是 “ 热 
门 ”轮子 ，Java 编译 器 会 知道 这 个 轮子 要 好 好 优化 ， 让 他 转 得 更 快 。 


14.3 Javac 编译 器 


Javac 编译 器 能 够 读 取 Java 源 代码 ， 并 将 其 编译 成 字 节 代码 ， 调 用 Javac 的 命令 行 
如 下 : 


C:>javac options filename.java 


此 命令 行 中 options 选项 的 具体 说 明 如 下 : 

口 “-classpath path: 此 选项 用 于 设 定 路 径 ， 在 该 路 径 上 Javac 寻找 需 被 调用 的 类 。 该 
路 径 是 一 个 用 分 号 分 开 的 目录 列表 。 

口 “-d directory: 此 选项 指定 一 个 根 目录 。 该 目录 用 来 创建 反映 软件 包 继承 关系 的 目 
录 数 。 

口 ”-g: 此 选项 在 代码 产生 器 中 打开 调试 表 ， 以 后 可 赁 此 调试 产生 字 节 代码 。 

口 “-nowam: 此 选项 禁止 编译 器 产生 警告 。 

口 “-o: 此 选项 告诉 javac 优化 由 内 联 的 static、final 以 及 privite 成 员 函 数 所 产生 
的 码 。 

口 “-verbose: 此 选项 告知 Java 显示 出 有 关 被 编译 的 源 文件 和 任何 被 调用 类 库 的 
信息 。 


14.3.1 Javac 命令 详解 


Javac 有 两 种 方法 可 将 源 代码 文件 名 传递 给 Javac: 

(1) 如 果 源 文件 数量 少 ， 在 命令 行 上 列 出 文件 名 即 可 。 

(2) 如 果 源 文件 数量 多 ， 则 将 源 文件 名 列 在 一 个 文件 中 ， 名 称 间 用 空格 或 回 车 行 来 进 
行 分 隔 。 然 后 在 Javac 命令 行 中 使 用 该 列表 文件 名 ， 文 件 名 前 冠 以 @ 字 符 。 

源 代码 文件 名 称 必须 含有 .java 后 级 ， 类 文件 名 称 必须 含有 .class 后 缀 ， 源 文件 和 类 
文件 都 必须 有 识别 该 类 的 根 名 。 例 如 ， 名 为 MyClass 的 类 将 写 在 名 为 MyClass.java 的 源 
文件 中 ， 并 被 编译 为 字 节 码 类 文件 MyClass.class。 

内 部 类 定义 产生 附加 的 类 文件 。 这 些 类 文件 的 名 称 将 内 部 类 和 外 部 类 的 名 称 结合 在 一 
起 ， 例 如 MyClass$MyInnerClass.class。 

应 当 将 源 文件 安排 在 反映 其 包 树 结构 的 目录 树 中 。 例 如 ， 如 果 将 所 有 的 源 文件 放 在 
/workspace 中 ， 那 么 com.mysoft.mypack.MyClass 的 代码 应 该 在 \workspace\com\mysoft\ 
mypack\MyClass.java 中 。 在 缺 省 情况 下 ， 编 译 器 将 每 个 类 文件 与 其 源 文件 放 在 同一 目录 
中 。 可 用 -d 选项 (请 参阅 后 面 的 选项 ) 指 定 其 他 目标 目录 。 工 具 读 取 用 Java 编程 语言 编写 
的 类 和 接口 定义 ， 并 将 它们 编译 成 字 节 码 类 文件 。 
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1. 查找 类 型 
当 编译 源 文件 时 ， 编 译 器 常常 需要 它 还 没有 识别 出 的 类 型 的 有 关 信 息 。 对 于 源 文件 中 
使 用 、 扩 展 或 实现 的 每 个 类 或 接口 ， 编 译 器 都 需要 其 类 型 信息 。 这 包括 在 源 文件 中 没有 明 
确 提 及 、 但 通过 继承 提供 信息 的 类 和 接口 。 
例如 ， 当 扩展 java.applet.Applet 时 还 要 用 到 Applet 的 祖先 类 : java.awt.Panel、 
java.awt.Container、java.awt.Component 和 java.awt.Object。 
当 编译 器 需要 类 型 信息 时 ， 它 将 查找 定义 类 型 的 源 文件 或 类 文件 。 编 译 器 先 在 自 举 类 
及 扩展 类 中 查找 ， 然 后 在 用 户 类 路 径 中 查找 。 用 户 类 路 径 通 过 两 种 途径 来 定义 ， 通过 设置 
CLASSPATH 环境 变量 或 使 用 -classpath 命令 行 选项 (有 关 详 细 资 料 ， 请 参阅 设置 类 路 
径 )。 如 果 使 用 -sourcepath 选项 ， 则 编译 器 在 sourcepath 指定 的 路 径 中 查找 源 文件 ， 否 
则 ， 编 译 器 将 在 用 户 类 路 径 中 查找 类 文件 和 源 文 件 。 可 用 -bootclasspath 和 -extdirs 选项 来 
指定 不 同 的 自 举 类 或 扩展 类 ， 参 阅 下 面 的 联 编选 项 。 
成 功 的 类 型 搜索 可 能 生成 类 文件 、 源 文件 或 两 者 兼 有 。 以 下 是 Javac 对 各 种 情形 进行 
的 处 理 : 
口 “ 搜 索 结果 只 生成 类 文件 而 没有 源 文 件 : Javac 使 用 类 文件 。 
口 “ 搜 索 结 果 只 生成 源 文件 而 没有 类 文件 : Javac 编译 源 文 件 并 使 用 由 此 生成 的 类 
文件 。 
口 “ 搜 索 结果 既 生 成 源 文 件 又 生成 类 文件 : 确定 类 文件 是 否 过 时 。 若 类 文件 已 过 时 ， 
则 Javac 重新 编译 源 文件 并 使 用 更 新 后 的 类 文件 。 否 则 ，Javac 直接 使 用 类 文件 。 
缺 省 情况 下 ， 只 要 类 文件 比 源 文件 旧 ，javac 就 认为 它 已 过 时 。-Xdepend 选项 指 
定 相 对 来 说 较 慢 但 却 比较 可 靠 的 过 程 。 
注意 ;Javac 可 以 隐 式 编译 一 些 没有 在 命令 行 中 提 及 的 源 文件 。 用 -verbose 选项 可 跟 
踪 自动 编译 。 
2. 文件 列表 


为 缩短 或 简化 Javac 命令 ， 可 以 指定 一 个 或 多 个 每 行 含有 一 个 文件 名 的 文件 。 在 命令 
行 中 ， 采 用 @ 字 符 加 上 文件 名 的 方法 将 它 指 定 为 文件 列表 。 当 javac 遇 到 以 @ 字 符 开头 的 
参数 时 ， 它 对 那个 文件 中 所 含 文件 名 的 操作 跟 对 命令 行 中 文件 名 的 操作 是 一 样 的 。 这 使 得 
Windows 命令 行 长 度 不 再 受 限制 。 

例如 ， 可 以 在 名 为 sourcefiles 的 文件 中 列 出 所 有 源 文件 的 名 称 ， 该 文件 可 能 是 下 面 的 
形式 。 

MyClassl.java 


MyClass2.java 
MyClass3.java 


然后 可 用 下 列 命 令 运行 编译 器 : 

C:> javac @sourcefiles 

3. 标准 选项 

编译 器 有 一 批 标准 选项 ， 目 前 的 开发 环境 支持 这 些 标准 选项 ， 将 来 的 版 本 也 将 支持 
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它 。 还 有 一 批 附 加 的 非 标 准 选项 是 目前 的 虚拟 机 实现 所 特有 的 ， 将 来 可 能 要 有 变化 。 非 标 
准 选 项 以 -又 打头 ， 下 面 列 出 了 Javac 的 标准 选项 。 

(1) -classpath 类 路 径 : 设置 用 户 类 路 径 ， 它 将 覆盖 CLASSPATH 环境 变量 中 的 用 户 
类 路 径 。 若 既 未 指定 CLASSPATH 又 未 指定 -classpath， 则 用 户 类 路 径 由 当前 目录 构成 。 
有 关 详 细 信息 ， 请 参阅 设置 类 路 径 。 

若 未 指定 -sourcepath 选项 ， 则 将 在 用 户 类 路 径 中 查找 类 文件 和 源 文件 。 

(2) -d 目录 : 设置 类 文件 的 目标 目录 。 如 果 某 个 类 是 一 个 包 的 组 成 部 分 ， 则 javac 将 
把 该 类 文件 放 入 反映 包 名 的 子 目录 中 ， 必 要 时 创建 目录 。 例 如 ， 如 果 指 定 -d c:\myclasses 
并 且 该 类 名 叫 com.mypackage.MyClass， 那 么 类 文件 就 叫 作 ci:\myclasses\com\mypackage\ 
MyClass.class。 

如 果 没 有 指定 -d 选项 ， 则 javac 将 把 类 文件 放 到 与 源 文件 相同 的 目录 中 。 

注意 : -d 选项 指定 的 目录 不 会 被 自动 添加 到 用 户 类 路 径 中 。 

(3) -deprecation: 显示 每 种 不 鼓励 使 用 的 成 员 或 类 的 使 用 或 覆盖 的 说 明 。 没 有 给 出 
-deprecation 选项 的 话 ，Javac 将 显示 这 类 源 文件 的 名 称 : 这 些 源 文件 使 用 或 覆盖 不 鼓励 使 
用 的 成 员 或 类 。 

(4) -encoding: 设置 源 文件 编码 名 称 ， 例 如 EUCJIS/SJIS 。 若 未 指定 -encoding 选 
项 ， 则 使 用 平台 缺 省 的 转换 器 。 

(5) -g: 生成 所 有 的 调试 信息 ， 包 括 局 部 变量 。 缺 省 情况 下 ， 只 生成 行 号 和 源 文 件 
信息 。 

(6) -g:none: 不 生成 任何 调试 信息 。 

(7) -g:{ 关 键 字 列表 }: 只 生成 某 些 类 型 的 调试 信息 ， 这 些 类 型 由 逗号 分 隔 的 关键 字 列 
表 所 指定 。 有 效 的 关键 字 有 : 

口 ”source: 源 文件 调试 信息 。 

口 lines: 行 号 调试 信息 。 

口 _vars: 局 部 变量 调试 信息 。 

(8) -nowam: 禁用 警告 信息 。 

(9) -0: 优化 代码 以 缩短 执行 时 间 。 使 用 -O 选项 可 能 使 编译 速度 下 降 、 生 成 更 大 的 
类 文件 并 使 程序 难以 调试 。 在 JDK1.2 以 前 的 版 本 中 ，Javac 的 -g 选项 和 -O 选项 不 能 
一 起 使 用 。 在 JDK 1.2 中 ， 可 以 将 -g 和 -O 选项 结合 起 来 ， 但 可 能 会 得 到 意 想不到 的 结 
果 ， 如 丢失 变量 或 重新 定位 代码 或 丢失 代码 。-O 选项 不 再 自动 打开 -depend 或 关闭 -g 选 
项 。 同 样 ，-O 选项 也 不 再 允许 进行 跨 类 内 髓 。 

(10) -sourcepath 源 路 径 : 指定 用 以 查找 类 或 接口 定义 的 源 代码 路 径 。 与 用 户 类 路 径 一 
样 ， 源 路 径 项 用 分 号 “:” 进 行 分 隔 ， 它 们 可 以 是 目录 、JAR 归档 文件 或 ZIP 归档 文件 。 
如 果 使 用 包 ， 那 么 目录 或 归档 文件 中 的 本 地 路 径 名 必须 反映 包 名 。 

注意 : 通过 类 路 径 查找 的 类 ， 如 果 找 到 了 其 源 文 件 ， 则 可 能 会 自动 被 重新 编译 。 

(11) -verbose: 元 长 输出 。 它 包括 了 每 个 所 加 载 的 类 和 每 个 所 编译 的 源 文件 的 有 关 
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4. 联 编选 项 


在 缺 省 情况 下 ， 类 是 根据 与 Javac 一 起 发 行 的 JDK 自 举 类 和 扩展 类 来 编译 。 但 javac 
也 支持 联 编 ， 在 联 编 中 ， 类 是 根据 其 他 Java 平台 实现 的 自 举 类 和 扩展 类 来 进行 编译 的 。 
联 编 时 ，-bootclasspath 和 -extdirs 的 使 用 很 重要 。 

下 面 列 出 了 Javac 的 联 编选 项 。 

(1) -target 版 本 : 生成 将 在 指定 版 本 的 虚拟 机 上 运行 的 类 文件 。 缺 省 情况 下 生成 与 
1.1 和 1.2 版 本 的 虚拟 机 都 兼容 的 类 文件 。JDK 1.2 中 的 javac 所 支持 的 版 本 有 : 

口 ”1.1: 保证 所 产生 的 类 文件 与 1.1 和 1.2 版 的 虚拟 机 兼容 。 这 是 默认 状态 。 

口 1.2: 生成 的 类 文件 可 在 1.2 以 后 版 本 版 的 虚拟 机 上 运行 ， 但 不 能 在 1.1 版 的 虚拟 

机 上 运行 。 

(2) -bootclasspath 自 举 类 路 径 : 根据 指定 的 自 举 类 集 进行 联 编 。 和 用 户 类 路 径 一 样 ， 
自 举 类 路 径 项 用 分 号 “:;” 进 行 分 隔 ， 它 们 可 以 是 目录 、JAR 归档 文件 或 ZIP 归档 文件 。 

(3) -extdirs 目录 : 根据 指定 的 扩展 目录 进行 联 编 。 目 录 是 以 分 号 分 隔 的 目录 列表 。 在 
指定 目录 的 每 个 JAR 归档 文件 中 查找 类 文件 。 

5 非 标准 选项 

下 面 列 出 了 Javac 的 非 标准 选项 : 

(1) -Xx: 显示 非 标准 选项 的 有 关 信息 并 退出 。 

(2) -Xdepend: 递归 地 搜索 所 有 可 获得 的 类 ， 以 寻找 要 重 编译 的 最 新 源 文件 。 该 选项 
将 更 可 靠 地 查找 需要 编译 的 类 ， 但 会 使 编译 进程 的 速度 大 为 减 慢 。 

(3) -Xstdout: 将 编译 器 信息 送 到 System.out 中 。 默 认 情 况 下 ， 编 译 器 信息 送 到 
System.err 中 。 

(4) -Xverbosepath: 说 明 如 何 搜索 路 径 和 标准 扩展 以 查找 源 文件 和 类 文件 。 

(5) -本 选项; 将 选项 传 给 javac 调用 的 java 启动 器 。 例 如 ，-J-Xms48m 将 启动 内 存 
设 为 48 兆 字 节 。 虽 然 它 不 以 -Xx 开头 ， 但 它 并 不 是 javac 的 “标准 选项 ”。 用 -J 将 选 
项 传 给 执行 用 Java 编写 的 应 用 程序 的 虚拟 机 是 一 种 公共 约定 。 

注意 : CLASSPATH、-classpath、-bootclasspath 和 -extdirs 并 不 指定 用 于 运行 Javac 的 
类 。 如 此 滥用 编译 器 的 实现 通常 没有 任何 意义 而 且 是 很 危险 的 。 如 果 确 实 需要 这 样 做 ， 可 
用 -J 选 项 将 选项 传 给 基本 的 Java 启动 器 。 


14.3.2 ”Javac 源码 与 调试 


Javac 编译 器 不 像 HotSpot 虚拟 机 那样 使 用 C++ 语言 [包含 少量 C 语言 ) 实 现 ， 它 本 身 就 
是 一 个 由 Java 语言 编写 的 程序 ， 这 为 纯 Java 的 程序 员 了 解 它 的 编译 过 程 带 来 了 很 大 的 
便利 。 

Javac 的 源码 存放 在 JDK_SRC HOME/langtools/src/share/classes/com/sun/tools/javac 
中 ， 除 了 JDK 自身 的 API 外 ， 就 只 引用 了 JDK_SRC HOME/langtools/src/share/classes/ 
com/sun/* 里 面 的 代码 ， 所 以 调试 环境 建立 起 来 简单 方便 ， 基 本 上 不 需要 处 理 依 赖 关 系 。 

以 Eclipse IDE 环境 为 例 ， 先 建立 一 个 名 为 “Compilerj avac” 的 Java 工程 ， 然 后 把 


KE. 
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JDK_SRC HOME/langtools/s rc/share/classe s/com/sun/* 目 录 下 的 源 文件 全 部 复制 到 工程 的 
源码 目录 中 。 在 导入 代码 期 间 ， 源 码 文件 AnnotationProxyMaker.java 可 能 会 提示 “Access 
Restriction”， 被 Eclipse 拒绝 编译 。 

这 是 由 于 Eclipse 的 JRE System Library 中 默认 包含 了 一 系列 的 代码 访问 规则 (Access 
Rules)， 如 果 代 码 中 引用 了 这 些 访问 规则 所 禁止 引用 的 类 ， 就 会 提示 这 个 错误 。 可 以 通过 
添加 一 条 允许 访问 Jar 包 中 所 有 类 的 访问 规则 来 解决 这 个 问题 。 导 入 了 Javac 的 源码 后 ， 就 
可 以 运行 com.sun.tools.javac.Main 的 main() 方 法 来 执行 编译 了 ， 与 命令 行 中 使 用 Javac 的 命 
令 没 有 什么 区 别 ， 编 译 的 文件 与 参数 在 Eclipse 的 Debug Configurations 面板 中 的 
Arguments 选项 卡 中 指定 。 

虚拟 机 规范 严格 定义 了 Class 文件 的 格式 ， 但 是 对 如 何 把 Java 源码 文件 转变 为 Class 
文件 的 编译 过 程 未 作 任何 定义 ， 所 以 这 部 分 内 容 是 与 具体 JDK 实现 相关 的 。 从 Sun Javac 
的 代码 来 看 ， 编 译 过 程 大 致 可 以 分 为 三 个 过 程 ， 分 别 是 : 

口 ”解析 与 填充 符号 表 过 程 。 

口 ” 插 入 式 注解 处 理 器 的 注解 处 理 过 程 。 

口 ”分 析 与 字 节 码 生 成 过 程 。 

Javac 编译 动作 的 入 口 是 com.sun.tools.javac.main.JavaCompiler 类 ， 上 述 三 个 过 程 的 代 
码 逻 辑 集 中 在 这 个 类 的 compileg0 和 compile20 方 法 里 ， 整 个 编译 最 关键 的 处 理 就 由 图 中 标 
注 的 8 个 方法 来 完成 ， 下 面 我 们 具体 看 一 下 这 8 个 方法 实现 了 什么 功能 。 


14.3.3 ”解析 与 填充 符号 表 


解析 步骤 包括 了 经 典 程序 编译 原理 中 的 词法 、 语 法 分 析 和 填充 符号 表 两 个 过 程 。 

1) 词法 、 语 法 分 析 

词法 分 析 是 将 源 代码 的 字符 流转 变 为 标记 (Token) 集 合 ， 单 个 字符 是 程序 编写 过 程 的 最 
小 元 素 ， 而 标记 则 是 编译 过 程 的 最 小 元 素 ， 关 键 字 、 变 量 名 、 字 面 量 和 运算 符 都 可 以 成 为 
标记 ， 如 “int a=b+2” 这 句 代 码 包含 了 6 个 标记 ， 分 别 是 int、a、=、b、+、2， 虽 然 关 键 
字 int 由 三 个 字符 构成 ， 但 是 它 只 是 一 个 Token， 不 可 再 拆 分 。 在 Javac 的 源码 中 ， 词 法 分 
析 过 程 由 com.sun.tools javac parser.Scanner 类 来 实现 。 

语法 分 析 是 根据 Token 序列 来 构造 抽象 语法 树 的 过 程 ， 抽 象 语法 树 (Abstract Syntax 
Tree，AST) 是 一 种 用 来 描述 程序 代码 语法 结构 的 树 形 表 示 方 式 ， 语 法 树 的 每 一 个 节点 都 代 
表 着 程序 代码 中 的 一 个 语法 结构 (Construct)， 例 如 包 、 类 型 、 修 饰 符 、 运 算 符 、 接 口 、 返 
回 值 甚至 连 代 码 注释 等 都 可 以 是 一 个 语法 结构 。 

通过 Eclipse AST View 插件 可 以 分 析 得 出 某 段 代码 的 抽象 语法 树 视图 ， 读 者 可 以 通过 
这 张 图 对 抽象 语法 树 有 一 个 直观 的 认识 。 在 Javac 的 源码 中 ， 语 法 分 析 过 程 由 
com.sun.tools.javac.parser.Parser 类 来 实现 ， 这 个 阶段 产 出 的 抽象 语法 树 由 
com.sun.tools.javac.tree.JCTree 类 来 表示 ， 经 过 这 个 步骤 之 后 ， 编 译 器 就 基本 不 会 再 对 源码 
文件 进行 操作 了 ， 后 续 的 操作 都 建立 在 抽象 语法 树 之 上 。 

2) 填充 符号 表 

完成 了 语法 分 析 和 词法 分 析 之 后 ， 下 一 步 就 是 填充 符号 表 的 过 程 ， 此 功能 是 通过 
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enterTrees() 方 法 实现 的 。 符 号 表 (Symbol Table) 是 由 一 组 符号 地 址 和 符号 信息 构成 的 表格 ， 
读者 可 以 把 它 想象 成 哈 希 表 中 K-V 值 对 的 形式 (实际 上 符号 表 不 一 定 是 哈 希 表 实现 ， 可 以 
是 有 序 符 号 表 、 树 状 符号 表 和 栈 结构 符号 表 等 )。 符 号 表 中 所 登记 的 信息 在 编译 的 不 同 阶段 
都 要 用 到 。 在 语义 分 析 中 ， 符 号 表 所 登记 的 内 容 将 用 于 语义 检查 (如 检查 一 个 名 字 的 使 用 和 
原先 的 说 明 是 否 一 致 ) 和 产生 中 间 代 码 。 在 目标 代码 生成 阶段 ， 当 对 符号 名 进行 地 址 分 配 
时 ， 符 号 表 是 地 址 分 配 的 依据 。 

在 Javac 源 代码 中 ， 填 充 符 号 表 的 过 程 由 com.sun.tools.j avac.comp.Enter 类 实现 ， 此 过 
程 的 出 口 是 一 个 待 处 理 列表 (To Do List)， 包 含 了 每 一 个 编译 单元 的 抽象 语法 树 的 顶级 节 
点 ， 以 及 package-info.java( 如 果 存 在 的 话 ) 的 顶级 节点 。 


14.3.4 注解 处 理 器 


JDK 1.5 之 后 ，Java 语言 提供 了 对 注解 (Annotations) 的 支持 ， 这 些 注 解 与 普通 的 Java 代 
码 一 样 ， 是 在 运行 期 间 发 挥 作用 的 。 在 JDK 1.6 中 实现 了 JSR-269 规范 ， 提 供 了 一 组 插入 
式 注解 处 理 器 的 标准 API， 在 编译 期 间 对 注解 进行 处 理 。 我 们 可 以 把 它 看 作 是 一 组 编译 器 
的 插件 ， 在 这 些 插 件 里 面 ， 可 以 读 取 、 修 改 、 添 加 抽象 语法 树 中 的 任意 元 素 。 如 果 这 些 插 
件 在 处 理 注解 期 间 对 语法 树 进行 了 修改 ， 那 么 编译 器 将 回 到 解析 及 填充 符号 表 的 过 程 重新 
处 理 ， 直 到 所 有 的 插入 式 注解 处 理 器 都 没有 再 对 语法 树 进行 修改 为 止 。 

有 了 编译 器 注解 处 理 的 标准 API 后 ， 我 们 的 代码 才 有 可 能 干涉 编译 器 的 行为 ， 由 于 语 
法 树 中 的 任意 元 素 ， 甚 至 包括 代码 注释 都 可 以 在 插件 之 中 访问 到 ， 所 以 通过 插入 式 注解 处 
理 器 实现 的 插件 在 功能 上 有 很 大 的 发 挥 空间 。 只 要 有 足够 的 创意 ， 程 序 员 可 以 使 用 插入 式 
注解 处 理 器 来 实现 许多 原本 只 能 在 编码 中 完成 的 事情 ， 本 章 最 后 有 一 个 使 用 插入 式 注解 处 
理 器 的 简单 实例 。 

在 Javac 源码 中 ， 插 入 式 注 解 处 理 器 的 初始 化 过 程 是 在 initPorcessAnnotations() 方 法 中 
完成 的 ， 而 它 的 执行 过 程 则 是 在 processAnnotations() 方 法 中 完成 的 ， 这 个 方法 判断 是 否 还 
有 新 的 注解 处 理 器 需要 执行 ， 如 果 有 的 话 ， 则 通过 com.sun.tools.javac.processing. 
JavacProcessingEnvironment 类 的 doProcessing() 方 法 生成 一 个 新 的 JavaCompiler 对 象 对 编译 
的 后 续 步 又 进行 处 理 。 


14.3.5 ”语义 分 析 与 字 节 码 生 成 


经 过 语法 分 析 之 后 ， 编 译 器 获得 了 程序 代码 的 抽象 语法 树 表 示 ， 语 法 树 能 表示 一 个 结 
构 正 确 的 源 程序 的 抽象 ， 但 无 法 保证 源 程序 是 符合 逻辑 的 。 而 语义 分 析 的 主要 任务 是 对 结 
构 上 正确 的 源 程序 进行 上 下 文 有 关 性 质 的 审查 ， 如 进行 类 型 审查 。 举 个 例子 ， 假 设 有 如 下 
的 三 个 变量 定义 语句 : 

inta=1; 
boolean b=false; 
char C=2; 


后 续 可 能 出 现 的 赋值 运算 如 下 : 


int d=atc; 
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int d=b+c: 
char d=atc; 

后 续 代码 中 如 果 出 现 了 如 上 三 种 赋值 运算 的 话 ， 那 它们 都 能 构成 结构 正确 的 语法 树 ， 
但 是 只 有 第 一 种 的 写法 在 语义 上 是 没有 问题 的 ， 能 够 通过 编译 ， 其 余 两 种 在 Java 语言 中 是 
不 合 逻辑 的 ， 无 法 编译 (是 否 合乎 语义 逻辑 必须 限定 在 具体 的 语言 与 具体 的 上 下 文 环境 之 中 
才 有 意义 。 如 在 C 语言 中 ，a、b、c 的 上 下 文 定义 不 变 ， 第 二 、 三 种 写法 都 是 可 以 被 正确 
编译 的 )。 

1) 检查 标注 

Javac 的 编译 过 程 中 ， 语 义 分 析 过 程 分 为 标注 检查 和 数据 及 控制 流 分 析 两 个 步 又， 分 
别 由 方法 attribute0 和 方法 How0 完 成 。 标 注 检查 步骤 检查 的 内 容 包 括 诸如 变量 使 用 前 是 否 
已 被 声明 、 变 量 与 赋值 之 间 的 数据 类 型 是 否 能 够 匹配 ， 等 等 。 在 标注 检查 步骤 中 ， 还 有 一 
个 重要 的 动作 称 为 常量 折 倒 ， 如 果 我 们 在 代码 中 写 了 如 下 定义 : 


int a=1+27 


在 语法 树 上 仍然 能 看 到 字面 量 “1”、“2” 和 操作 符 “+” 号 ， 但 是 在 经 过 常量 折 悉 
之 后 ， 它 们 将 会 被 折 释 为 字面 量 “3”。 这 个 插入 式 表达 式 (Infix Expression) 的 值 已 经 在 语 
法 树 上 标注 出 来 了 (ConstantExpressionValue: 3)。 由 于 编译 期 间 进 行 了 常量 折 县 ， 所 以 在 
代码 里 面 定义 “a=1+2” 比 起 直接 定义 “a=3”， 并 不 会 增加 程序 运行 期 哪怕 仅仅 一 个 CPU 
指令 的 运算 量 。 

标注 检查 步骤 在 Javac 源码 中 的 实现 类 是 com.sun.tools.javac.comp.Attr 类 和 
com.sun.tools.javac.comp.Check 类 。 

2) 数据 及 控制 流 分 析 

数据 及 控制 流 分 析 是 对 程序 上 下 文 逻 辑 更 进一步 的 验证 ， 它 可 以 检查 出 诸如 程序 局 部 
变量 在 使 用 前 是 否 有 赋值 、 方 法 的 每 条 路 径 是 否 都 有 返回 值 、 是 否 所 有 的 受 查 异 常 都 被 正 
确 处 理 了 等 问题 。 编 译 时 期 的 数据 及 控制 流 分 析 与 类 加 载 时 的 数据 及 控制 流 分 析 的 目的 基 
本 上 是 一 致 的 ， 但 校 验 范围 有 所 区 别 ， 有 一 些 校 验 项 只 有 在 编译 期 或 运行 期 才能 进行 。 下 
面 举 一 个 关于 final 修饰 符 的 数据 及 控制 流 分 析 的 例子 ， 演 示 代码 14-1 如 下 。 

演示 代码 14-1 

// 方 法 1 有 final 修饰 

public void foo(final int arg) { 
final int var = 0; 
// do something 

// 方 法 2 没有 final 修饰 

public void foo(int arg) { 
final int var = 0; 
// do something 

在 上 述 代 码 的 两 个 foo0 方 法 中 ， 一 个 方法 的 参数 和 局 部 变量 定义 使 用 了 final 修饰 
符 ， 另 外 一 个 则 没有 ， 在 代码 编写 时 程序 肯定 会 受到 final 修饰 符 的 影响 ， 不 能 再 改变 arg 
和 var 变量 的 值 ， 但 是 这 两 段 代码 编译 出 来 的 Class 文件 是 没有 任何 一 点 区 别 的 ， 局 部 变 
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量 与 字段 (实例 变量 、 类 变量 ) 是 有 区 别 的 ， 它 在 常量 池 中 没有 CONSTANT Fieldref info 的 
符号 引用 ， 自 然 就 没有 访问 标志 (Access Flags) 的 信息 ， 甚 至 可 能 连 名 称 都 不 会 被 保留 下 来 
(取决 于 编译 时 的 选项 )， 自 然 在 Class 文件 中 不 可 能 知道 一 个 局 部 变量 是 不 是 被 声明 为 final 
了 。 因 此 ， 将 局 部 变量 声明 为 final， 对 运行 期 是 没有 影响 的 ， 变 量 的 不 变性 仅仅 由 编译 器 
在 编译 期 间 保障 。 在 Javac 的 源码 中 ， 数 据 及 控制 流 分 析 的 入 口 是 flow0 方法 ， 具 体操 作 
由 com.sun.tools.javac.comp Flow 类 来 完成 。 

3) 解 语法 糖 

语法 糖 (Syntactic Sugan ， 也 称 糖衣 语法 ， 是 由 英国 计算 机 科学 家 彼得 "约翰 * 兰 达 
( Peter J， Landin) 发 明 的 一 个 术语 ， 指 在 计算 机 语言 中 添加 的 某 种 语法 ， 这 种 语法 对 语言 
的 功能 并 没有 影响 ， 但 是 更 方便 程序 员 使 用 。 通 常 来 说 使 用 语法 糖 能 够 增加 程序 的 可 读 
性 ， 从 而 减少 程序 代码 出 错 的 机 会 。 

相对 于 C# 及 许多 其 他 JVM 语言 来 说 ，Java 在 现代 编程 语言 之 中 属于 “低糖 语言 ”。 
尤其 是 JDK 1.5 之 前 的 版 本 ，“ 低 糖 ” 语 法 也 是 Java 语言 被 怀疑 已 经 “落后 ”的 一 个 表面 
理由 。Java 中 最 常用 的 语法 糖 主要 是 前 面 提 到 过 的 泛 型 ( 泛 型 并 不 一 定 都 是 语法 糖 实现 ， 如 
C# 的 泛 型 就 是 直接 由 CLR 支持 的 )、 变 长 参数 、 自 动 装 箱 拆 箱 ， 等 等 ， 虚 拟 机 运行 时 不 支 
持 这 些 语 法 ， 它 们 在 编译 阶段 被 还 原 回 简单 的 基础 语法 结构 ， 这 个 过 程 就 称 为 解 语法 糖 。 

在 Javac 的 源码 中 ， 解 语法 糖 的 过 程 由 desugar0 方 法 触发 ， 在 com.sun.tools. 
javac.comp.TransTypes 类 和 com.sun.tools.j avac.comp.Lower 类 中 完成 。 

4) 字 节 码 生成 

字 节 码 生 成 是 Javac 编译 过 程 的 最 后 一 个 阶段 ， 在 Javac 源码 里 面 由 
com.sun.tools.javac.jvm.Gen 类 来 完成 。 字 节 码 生成 阶段 不 仅仅 是 把 前 面 各 个 步骤 所 生成 的 
信息 (语法 树 、 符 号 表 ) 转 化 成 字 节 码 写 到 磁盘 中 ， 编 译 器 还 进行 了 少量 的 代码 添加 和 转换 
工作 

例如 前 面 章 节 中 多 次 提 到 的 实例 构造 器 <init>0 方 法 和 类 构造 器 <clinit>0 方 法 就 是 在 这 
个 阶段 被 添加 到 语法 树 之 中 的 (请 注意 这 里 的 实例 构造 器 并 不 是 指 默认 构造 函数 ， 如 果 用 户 
代码 中 没有 提供 任何 构造 函数 ， 那 编译 器 将 会 添加 一 个 没有 参数 的 、 访 问 性 (public、 
protected 或 private) 与 当前 类 一 致 的 默认 构造 数 ， 这 个 工作 在 填充 符号 表 阶 段 就 已 经 完 
成 )， 这 两 个 构造 器 的 产生 过 程 实际 上 是 一 个 代码 收敛 的 过 程 ， 编 译 器 会 把 语句 块 (对 于 实 
例 构 造 器 而 言 是 “{)” 块 ， 对 于 类 构造 器 而 言 是 “static{}” 块 )、 变 量 初始 化 (实例 变量 和 
类 变量 )、 调 用 父 类 的 实例 构造 器 (仅仅 是 实例 构造 器 ，<clinit>() 方 法 中 无 须 调 用 父 类 的 
<clinit>(0 方 法 ， 虚 拟 机 会 自动 保证 父 类 构造 器 的 执行 ， 但 在 <clinit>() 方 法 中 经 常会 生成 调 
用 javalang.Obj ect 的 <ini>0 方 法 的 代码 ) 等 操作 收敛 到 <init>0 和 <clini>0 方 法 之 中 ， 并 且 
保证 一 定 是 按 先 执行 父 类 的 实例 构造 器 ， 然 后 初始 化 变量 ， 最 后 执行 语句 块 的 顺序 进行 ， 
上 面 所 述 的 动作 由 Gen.normalizeDefs() 方 法 来 实现 。 除 了 生成 构造 器 以 外 ， 还 有 其 他 的 一 
些 代码 蔡 换 工作 用 于 优化 程序 的 实现 逻辑 ， 如 把 字符 串 的 加 操作 蔡 换 为 StringBuffer 或 
StringBuilder( 取 决 于 目标 代码 的 版 本 是 否 大 于 或 等 于 JDK1.5) 的 append() 操 作 ， 等 等 。 

完成 了 对 语法 树 的 遍历 和 调整 之 后 ， 就 会 把 填充 了 所 有 所 需 信 息 的 符号 表 交 到 
com.sun.tools.javac.jvm.ClassWriter 类 手 上 ， 由 这 个 类 的 writeClass() 方 法 输出 字 节 码 ， 生 成 
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最 终 的 Class 文件 ， 到 此 为 止 整个 编译 过 程 宣告 结束 。 
14.3.6 Javac 编译 实例 
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了 解 了 Javac 命令 的 基本 参数 的 含义 后 ， 接 下 来 将 通过 具体 实例 来 演示 这 些 参数 的 使 


用 方法 。 
1) 编译 简单 程序 


假设 有 一 个 源 文件 Hellojava ， 它 定义 了 一 个 名 叫 greetings.Hello 的 类 。greetings 目 
录 是 源 文件 和 类 文件 两 者 的 包 目 录 ， 且 它 不 是 当前 目录 。 这 让 我 们 可 以 使 用 默认 的 用 户 类 


路 径 。 它 也 使 我 们 没 必要 用 -d 选项 指定 单独 的 目标 目录 。 


Ci> dir 

greetings/ 

C:> dir greetings 

Hello.java 

C:> cat greetings\Hello.java 

package greetings; 

public class Hello { 

public static void main(String[] args) { 
for (int i=0; i < args.length; i++) { 
System.out .println("Hello " + args[i]); 
} 

} 

} 

C:> javac greetings\Hello.java 

C:> dir greetings 

Hello.class Hello.java 

C:> java greetings.Hello World Universe Everyone 
Hello World 

Hello Universe 

Hello Everyone 


2) 编译 多 个 源 文件 
下 面 的 实例 可 以 编译 greetings 包 中 的 所 有 源 文件 。 


Ci:> dir 

greetings\ 

C:> dir greetings 

Aloha.java GutenTag .java Hello.java 
C:> javac greetings\*.java 

C:> dir greetings 

Aloha.class GutenTag.class Hello.class 
Aloha.java GutenTag .java Hello.java 


3) 指定 用 户 类 路 径 
对 前 面 实例 中 的 某 个 源 文件 进行 更 改 后 ， 然 后 重新 编译 它 : 
Cc:> cd 


\examples 
C:> javac greetings\Hi.java 


Hi.java 


Hi.class 
Hi.java 


由 于 greetings.Hi 引用 了 greetings 包 中 其 他 的 类 ， 编 译 器 需要 找到 这 些 其 他 的 类 。 上 
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面 的 示例 能 运行 是 因为 默认 的 用 户 类 路 径 刚 好 是 含有 包 目 录 的 目录 。 但 是 ， 假 设 我 们 想 重 
新 编译 该 文件 并 且 不 关心 我 们 在 哪个 目录 中 的 话 ， 我 们 需要 将 “\examples” 添 加 到 用 户 
类 路 径 中 。 可 以 通过 设置 CLASSPATH 达到 此 目的 ， 但 这 里 我 们 将 使 用 -classpath 选项 
来 完成 。 

C:>javac -classpath \examples \examples\greetings\Hi.java 


如 果 再 次 将 greetings.Hi 改 为 使 用 标题 实用 程序 ， 该 实用 程序 也 需要 通过 用 户 类 路 径 
来 进行 访问 : 
C:>javac -classpath \examples:\lib\Banners.jar \ 
\examples\greetings\Hi.java 


要 想 执行 greetings 中 的 类 ， 需 要 访问 greetings 和 它 所 使 用 的 类 。 


C:>java -classpath \examples:\lib\Banners.jar greetings.Hi 


4) 将 源 文件 和 类 文件 分 开 

将 源 文件 和 类 文件 置 于 不 同 的 目录 下 经 常 是 很 有 意义 的 ， 特 别 是 在 大 型 的 项 目 中 。 我 
们 用 -d 选项 来 指明 单独 的 类 文件 目标 位 置 。 由 于 源 文件 不 在 用 户 类 路 径 中 ， 所 以 用 
-sourcepath 选项 来 协助 编译 器 查找 它们 。 


C:> GIF 

classes\ 1ib\ src\ 

Ce Lr re 

farewells\ 

C:> dir src\farewells 

Base.java GoodBye.java 

Cc:> dir Tib 

Banners.jar 

C:> dir classes 

C:> javac -sourcepath src -classpath classes:lib\Banners.jar \ 
src\farewells\GoodBye.java -d classes 
C:> dir classes 


farewells\ 
C:> dir classes\farewells 
Base.class GoodBye.class 


编译 器 也 编译 了 src\farewells\Base.java， 虽 然 没 有 在 命令 行 中 指定 它 。 要 想 跟 踪 自 动 
编译 ， 可 使 用 -verbose 选项 来 实现 。 


14.3.7 ”Javac 的 源码 与 调试 


在 MyEclipse 中 新 建 一 个 Java 项 目 ， 将 Javac 的 源码 导入 进去 ， 导 入 期 间 ， 源 码 文件 
AnnotationProxyMaker.java 会 报错 ， 被 myeclipse 拒绝 编译 。 这 是 由 于 myeclipse 的 JRE 
System Library 中 默认 包含 了 一 系列 的 代码 访问 规则 (Access Rules)， 如 果 代 码 中 引用 了 这 
些 访问 规则 所 禁止 引用 的 类 ， 就 会 提示 这 个 错误 。 可 以 通过 添加 一 条 允许 访问 jar 包 中 所 
有 类 的 访问 规则 来 解决 这 个 问题 。 

导入 了 Javac 的 源码 之 后 ， 就 可 以 运行 com.sun.tools.javac.Main 的 main() 方 法 来 执行 编 
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译 了 ， 与 命令 行 中 使 用 Javac 的 命令 没有 什么 区 别 。 虚 拟 机 规范 严格 定义 了 Class 文件 的 格 
式 ， 但 是 对 如 何 把 Java 源码 文件 转变 为 Class 文件 的 编译 过 程 未 作 任何 定义 ， 所 以 这 部 分 
内 容 是 与 具体 JDK 实现 相关 的 。 从 Sun Javac 的 代码 来 看 ， 编 译 过 程 大 致 可 以 分 为 三 个 过 
程 ， 分 别 是 : 
口 ”解析 与 填充 符号 表 过 程 ; 
口 ” 插 入 式 注解 处 理 器 的 注解 处 理 过 程 ; 
口 ”分 析 与 字 节 码 生 成 过 程 。 
Javac 编译 动作 的 入 口 是 com.sun.tools.javac.main.JavaCompiler 类 ， 上 述 三 个 过 程 的 代 
码 逻 辑 集中 在 这 个 类 的 compile0 和 compile20 方 法 里 。 整 个 编译 最 关键 的 处 理 是 由 8 个 方 
法 来 完成 的 ， 分 别 是 : 
initProcessAnnotations (processors) ;// 准 备 过 程 : 初始 化 插入 式 注解 处 理 器 
delegateCompiler = 
processAnootations( // 过 程 2: 执行 注解 处 理 
enterTrees (stopIfError (Compilestate .PARSE, // 过 程 1.2: 输入 到 符号 表 


parseFiles (sourceFileObject))), // 过 程 1 .1: 词法 分 析 、 语 法 分 析 
classnames); 


delegateCompiler.compile2();  // 过 程 3: 分 析 及 字 节 码 生 成 
case BY TODO: 
while(! todo.isEmpty()) 
generate (desugar (flow (attribute (todo.remove())))); 
break; 
//generate, 过程 3.4: 生成 字 节 码 
//desugar， 过 程 3.3 解 语法 糖 
//flow， 过 程 3.2: 数据 流 分 析 
//attribute， 过 程 3.1: 标注 


14.4 _ Java 语法 糖 的 味道 


几乎 各 种 语言 或 多 或 少 都 提供 过 一 些 语 法 糖 来 方便 程序 员 的 代码 开发 ， 这 些 语法 糖 虽 
然 不 会 提供 实质 性 的 功能 改进 ， 但 是 它们 或 能 提高 效率 ， 或 能 提升 语法 的 严谨 性 ， 或 能 减 
少 编码 出 错 的 机 会 。 不 过 也 有 一 种 观点 认为 语法 糖 并 不 一 定 都 是 有 益 的 ， 大 量 添加 和 使 用 
含 糖 的 语法 容易 让 程序 员 产 生 依赖 ， 无 法 看 清 语法 糖 的 糖衣 背后 程序 代码 的 真实 面目 。 总 
而 言 之 ， 语 法 糖 可 以 看 做 是 编译 器 实现 的 一 些 “ 小 把 戏 ”， 这 些 “ 小 把 戏 ” 可 能 会 使 得 效 
率 有 一 个 “大 提升 ”， 但 我 们 也 应 该 去 了 解 这 些 “ 小 把 戏 ” 背 后 的 真实 世界 ， 那 样 才 能 利 
用 好 它们 ， 而 不 是 被 它们 所 迷惑 。 


14.4.1 泛 型 与 类 型 擦 除 


泛 型 是 JDK 1.5 的 一 项 新 特性 ， 它 的 本 质 是 参数 化 类 型 (Parameterized Type) 的 应 用 ， 也 
就 是 说 所 操作 的 数据 类 型 被 指定 为 一 个 参数 。 这 种 参数 类 型 可 以 用 在 类 、 接 口 和 方法 的 创 
建 中 ， 分 别称 为 泛 型 类 、 泛 型 接口 和 泛 型 方法 。 
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泛 型 思想 早 在 C++ 语 言 的 模板 (Templates) 中 就 开始 生根 发 芽 ， 在 Java 语言 还 没有 出 现 
泛 型 时 ， 只 能 通过 Object 是 所 有 类 型 的 父 类 和 类 型 强制 转换 两 个 特点 的 配合 来 实现 类 型 泛 
化 。 例 如 在 哈 希 表 的 存 取 中 ，JDK 15 之 前 使 用 HashMap 的 get0 方 法 ， 返 回 值 就 是 一 个 
Obj ect 对象 ， 由 于 Java 语言 里 面 所 有 的 类 型 都 继承 于 java.lang.Object， 那 Object 转型 成 任 
何 对 象 都 是 有 可 能 的 。 但 是 也 因为 有 无 限 的 可 能 性 ， 就 只 有 程序 员 和 运行 期 的 虚拟 机 才 知 
道 这 个 Object 到 底 是 个 什么 类 型 的 对 象 。 在 编译 期 间 ， 编 译 器 无 法 检查 这 个 Object 的 强制 
转型 是 否 成 功 ， 如 果 仅仅 依赖 程序 员 去 保障 这 项 操作 的 正确 性 ， 许 多 ClassCastException 
的 风险 就 会 被 转嫁 到 程序 运行 期 中 。 
泛 型 技术 在 C# 和 Java 之 中 的 使 用 方式 看 似 相同 ， 但 实现 上 却 有 着 根本 性 的 分 歧 ， C# 
里 面 泛 型 无 论 在 程序 源码 中 、 编 译 后 的 代 中 (Intermediate Language， 中 间 语 言 ， 这 时 候 泛 
型 是 一 个 占 位 符 ) 还 是 运行 期 的 CLR 中 都 是 切实 存在 的 ，List<int> 与 Lis<Sting> 就 是 两 个 
不 同 的 类 型 ， 它 们 在 系统 运行 期 生成 ， 有 自己 的 虚 方法 表 和 类 型 数据 ， 这 种 实现 称 为 类 型 
膨胀 ， 基 于 这 种 方法 实现 的 泛 型 被 称 为 真实 泛 型 。 
Java 语言 中 的 泛 型 则 不 一 样 ， 它 只 在 程序 源码 中 存在 ， 在 编译 后 的 字 节 码 文件 中 ， 就 
已 经 被 替换 为 原来 的 原生 类 型 (Raw Type， 也 称 为 裸 类 型 ) 了 ， 并 且 在 相应 的 地 方 插入 了 强 
制 转型 代码 ， 因 此 对 于 运行 期 的 Java 语言 来 说 ，ArrayList<int> 与 ArrayList<String> 就 是 同 
一 个 类 。 所 以 说 泛 型 技术 实际 上 是 Java 语言 的 一 颗 语 法 糖 ，Java 语言 中 的 泛 型 实现 方法 称 
为 类 型 擦 除 ， 基 于 这 种 方法 实现 的 泛 型 被 称 为 伪 泛 型 。 
演示 代码 14-2 是 一 段 简单 的 Java 泛 型 例子 ,我们 可 以 看 一 下 它 编译 后 的 结果 是 怎 
样 的 。 
演示 代码 14-2 


public static void main(String[] args) { 
Map<String, String> map = new HashMap<String，String>() 7 
map.put ("hello"，" 你 好 ") 
map.put ("how are You?"，" 吃 了 没 ? "); 
System.out .println (map.get ("hello")); 
System.out .println (map.get ("how are you?")); 

} 


把 这 段 Java 代码 编译 成 Class 文件 ， 然 后 再 用 字 节 码 反 编译 工具 进行 反 编译 后 ， 将 会 
发 现 泛 型 都 不 见 了 ， 程 序 又 变 回 了 Java 泛 型 出 现 之 前 的 写法 ， 泛 型 类 型 都 变 回 了 原生 类 
型 ， 如 演示 代码 14-3 所 示 。 

演示 代码 14-3 


public static void main (String[] args) { 
Map map = new HashMap () 
map.put ("hello"，" 你 好 ") ; 
map.put ("how are You2?"，" 吃 了 没 ? "); 
System.out .println((String) map.get ("hello")); 
System.out .println((String) map.get ("how are you?")); 
} 


因为 实现 简单 、 兼 容 性 考虑 还 是 别 的 原因 ? 我 们 已 不 得 而 知 ， 但 确实 有 不 少 人 对 Java 
语言 提供 的 伪 泛 型 颇 有 微 词 。 在 当时 众多 的 批评 之 中 ， 有 一 些 是 比较 表面 的 ， 还 有 一 些 从 
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性 能 上 说 泛 型 会 由 于 强制 转型 操作 和 运行 期 缺少 针对 类 型 的 优化 等 原因 从 而 导致 比 C# 的 泛 
型 慢 一 些 ， 则 是 完全 偏离 了 方向 ， 姑 上 且 不 论 Java 泛 型 是 不 是 真 的 会 比 C# 泛 型 惕 ， 选 择 从 
性 能 的 角度 上 评价 用 于 提升 语义 准确 性 的 泛 型 思想 但 笔者 也 并 非 在 为 Java 的 泛 型 辩护 ， 它 
在 某 些 场景 下 确实 存在 不 足 ， 笔 者 认为 通过 擦 除法 来 实现 泛 型 均 失 了 泛 型 思想 一 些 应 有 的 
优雅 ， 例 如 演示 代码 14-4 的 例子 。 

演示 代码 14-4 


public class GenericTypes { 
public static void method (List<String> list) { 
System.out .println("invoke method (List<String> list)"); 
} 
public static void method (List<Integer> list) { 
System.out.println ("invoke method (List<Integer> list)"); 
} 
} 


请 想 一 想 ， 上 面 这 段 代码 是 否 正确 ， 能 否 编译 执行 ? 也 许 您 已 经 有 了 答案 ， 这 段 代码 
是 不 能 被 编译 的 ， 是 因为 参数 List<Integer> 和 List<String> 编 译 之 后 都 被 擦 除 了 ， 变 成 了 一 
样 的 原生 类 型 List<E>， 擦 除 动作 导致 这 两 个 方法 的 特征 签名 变 得 一 模 一 样 。 初 步 看 来 ， 
无 法 重 载 的 原因 已 经 找到 了 ， 但 是 真 的 就 是 如 此 吗 ? 只 能 说 ， 泛 型 擦 除 成 相同 的 原生 类 型 
只 是 无 法 重 载 的 一 部 分 原因 ， 请 再 接着 看 一 看 演示 代码 14-5 中 的 内 容 。 
演示 代码 14-5 
public class GenericTypes { 
public static string method(List<string> list) { 
System.out.println ("invoke method (List<String> list)"); 
return ""; 
} 
public static int method(List<Integer> list) { 
System.out.println ("invoke method (List<Integer> 1ist)"); 
return 1; 
} 
public static void main(String[] args) { 
method (new ArrayList<string>()); 
method (new ArrayList<Integer>()); 
} 
} 
执行 结果 为 : 
invoke method (List<string> list) 
invoke method (List<Integer> list) 
演示 代码 14-5 与 演示 代码 14-4 的 差别 ， 是 两 个 method 方法 添加 了 不 同 的 返回 值 ， 由 
于 这 两 个 返回 值 的 加 入 ， 方 法 重 载 居然 成 功 了 ， 即 这 段 代码 可 以 被 编译 和 执行 了 。 测 试 的 
时 候 请 使 用 Sun JDK 的 Javac 编译 器 进行 编译 ， 其 他 编译 器 ， 如 Eclipse JDT 的 ECJ 编译 
器 ， 仍 然 可 能 会 拒绝 编译 这 段 代 码 ，ECJ 编译 时 会 提示 “Method method(List<String>has 
the same erasure method(List<E>as another method in type GenericTypes” 。 
这 是 我 们 对 Java 语言 中 返回 值 不 参与 重 载 选 择 的 基本 认 知 的 挑战 吗 ? 演示 代码 14-5 
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中 的 重 载 当 然 不 是 根据 返回 值 来 确定 的 ， 之 所 以 这 次 能 编译 和 执行 成 功 ， 是 因为 两 个 
mehtod() 方 法 加 入 了 不 同 的 返回 值 后 才能 共存 在 一 个 Class 文件 之 中 。 因 为 方法 重 载 要 求 方 
法 具备 不 同 的 特征 签名 ， 返 回 值 并 不 包含 在 方法 的 特征 签名 之 中 ， 所 以 返回 值 不 参与 重 载 
选择 ， 但 是 在 Class 文件 格式 之 中 ， 只 要 描述 符 不 是 完全 一 致 的 两 个 方法 就 可 以 共存 。 也 
就 是 说 两 个 方法 如 果 有 相同 的 名 称 和 特征 签名 ， 但 返回 值 不 同 ， 那 它们 也 是 可 以 合法 地 共 
存 于 一 个 Class 文件 中 的 。 

由 于 Java 泛 型 的 引入 ， 各 种 场景 (虚拟 机 解析 、 反 射 等 ) 下 的 方法 调用 都 可 能 对 原 有 的 
基础 产生 影响 和 新 的 需求 ， 如 在 泛 型 类 中 如 何 获取 传人 的 参数 化 类 型 等 。 所 以 JCP 组 织 对 
虚拟 机 规范 做 出 了 相应 的 修改 ， 引 入 了 诸如 Signature 和 LocalVariableTypeTable 等 新 的 属 
性 用 于 解决 伴随 泛 型 而 来 的 参数 类 型 的 识别 问题 ，Signature 是 其 中 最 重要 的 一 项 属性 ， 它 
的 作用 就 是 存储 一 个 方法 在 字 节 码 层面 的 特征 签名 ， 这 个 属性 中 保存 的 参数 类 型 并 不 是 原 
生 类 型 ， 而 是 包括 了 参数 化 类 型 的 信息 。 修 改 后 的 虚拟 机 规范 要 求 所 有 能 识别 49.0 以 上 版 
本 的 Class 文件 的 虚拟 机 都 要 能 正确 地 识别 Signature 参数 。 

从 上 面 的 例子 可 以 看 到 擦 除法 对 实际 编码 带 来 的 影响 ， 由 于 List<String> 和 
List<Integer> 擦 除 后 是 同一 个 类 型 ， 我 们 只 能 添加 两 个 并 不 需要 实际 使 用 到 的 返回 值 才能 
完成 重 载 ， 这 是 一 种 毫 无 优雅 和 美感 可 言 的 解决 方案 。 同 时 ， 从 Signature 属性 的 出 现 我 们 
还 可 以 得 出 结论 ， 的 除法 所 谓 的 控 除 ， 仅 仅 是 对 方法 的 Code 属性 中 的 字 节 码 进行 控 除 ， 
实际 上 元 数据 中 还 是 保留 了 泛 型 信息 ， 这 也 是 我 们 能 通过 反射 手段 取得 参数 化 类 型 的 根本 
依据 。 


14.4.2 自动 装 箱 、 拆 箱 与 遍历 循环 


就 纯 技 术 的 角度 而 论 ， 自 动 装 箱 、 自 动 拆 箱 与 遍历 循环 (Foreach 循环 ) 这 些 语 法 糖 ， 无 
论 是 实现 上 还 是 思想 上 都 不 能 和 上 一 节 介绍 的 泛 型 相 比 ， 两 者 的 难度 和 深度 都 有 很 大 的 差 
距 。 专 门 拿 出 一 节 来 讲解 它们 只 有 一 个 理由 : 毫 无 疑问 ， 它 们 是 Java 语言 里 面 被 使 用 得 最 
多 的 语法 糖 。 我 们 通过 下 面 的 演示 代码 14-6 和 演示 代码 14-7， 来 看 看 这 些 语法 糖 在 编译 后 
会 发 生 什么 样 的 变化 。 

演示 代码 14-6 


public static void main(String[] args) { 
List<Integer> list = Arrays.asList(], 2, 3, 4); 
// ”rtpxA JDK 1.7 中 还 有 另外 一 颗 语法 糖 
// 可 以 让 上 述 代码 进一步 简化 为 List<Integer> list = [1,2,3,4]; 
Int SOUTLL := 0 
Formtinte ts AloEy 
Sum += 工 7 
Systam.out .println (sum) ; 
|; 


演示 代码 14-7 


public static void main(String[1 args) { 
List list = Arrays.asList( new Integerf] { 
Integer.valueOof (1) ， 
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Integer-valueotf ( 2 ) v 
Integer.valueOf (3) ， 
Integer.valueof (4) }) > 
int SUIT1 = 0; 
for (Iterator locaiiterator = list.iterator(); 
localIterator.hasNext(); ) { 
int i = ( (Integer)1localIterator.next () ) .intValue (); 
sum += i, 
} 
System.out.println (sum) ; 


演示 代码 14-6 中 共 包 含 了 泛 型 、 自 动 装 箱 、 自 动 拆 箱 、 遍 历 循 环 与 变 长 参数 5 种 语法 
糖 ， 演 示 代 码 14-7 则 展示 了 它们 在 编译 后 的 变化 。 泛 型 就 不 必 说 了 ， 自 动 装 箱 、 拆 箱 在 编 
译 之 后 被 转化 成 了 对 应 的 包装 和 还 原 方法 ， 如 本 例 中 的 Integer.valueOf() 与 Integer.intValue() 
方法 ， 而 遍历 循环 则 是 把 代码 还 原 成 了 迭代 器 的 实现 ， 这 也 是 为 何 遍历 循环 需要 被 遍历 的 
类 实现 Iterable 接口 的 原因 。 最 后 再 看 看 变 长 参数 ， 它 在 调用 的 时 候 变 成 了 一 个 数组 类 型 
的 参数 ， 在 变 长 参数 出 现 之 前 ， 程 序 员 就 是 使 用 数组 来 完成 类 似 功能 的 。 

这 些 语 法 糖 虽 然 看 起 来 很 简单 ， 但 也 不 见得 就 没有 任何 值得 我 们 注意 的 地 方 ， 演 示 代 
码 14-8 演示 了 自动 装 箱 的 一 些 错误 用 法 。 


演示 代码 14-8 
public static void main (String[] args) { 
Integer a = 1; 
Integer bp = 2; 
Integer C = 3; 
Integer d= 3; 
Integer e = 321; 
Integer f£ = 321; 
Long g = 3L; 
System.out.println (c == d); 
System.out.println(e -N f) ， 
System-out .println(C == (a+b) ) :， 
System.out .println (c.equals (a + b) ) : 
System-out .println(g == (a + b) ) ， 


System.out .println (g.equals (a + b) ) :; 


看 完 演示 代码 14-8， 不 妨 思考 两 个 问题 : 一 是 代码 中 的 这 6 句 打印 语句 的 输出 是 什 
么 ? 二 是 这 六 名 打印 语句 中 ， 解 除 语法 糖 后 参数 会 是 什么 样子 ? 这 两 个 问题 的 答案 很 容易 
就 都 能 试验 出 来 ， 笔 者 在 此 暂且 略 去 答案 ， 希 望 读者 自己 上 机 实践 一 下 。 无 论 你 的 回答 是 
否 正确 ， 鉴 于 包装 类 的 “一 ”运算 在 没有 遇 到 算术 运算 的 情况 下 不 会 自动 拆 箱 ， 而 且 它们 
的 equals() 方 法 不 会 处 理 数 据 转 型 的 关系 ， 笔 者 建议 在 实际 编码 中 应 尽量 避免 这 样 来 使 用 
自动 装 箱 与 拆 箱 。 


14.4.3 条件 编译 
许多 程序 设计 语言 都 提供 了 条 件 编译 的 途径 ， 如 C、C++ 中 使 用 预 处 理 器 指示 符 
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(fdeb 来 完成 条 件 编译 。C、C++ 的 预 处 理 器 最 初 的 任务 是 解决 编译 时 的 代码 依赖 关系 ( 众 
所 周知 的 ##nclude 预 处 理 命令 )， 而 在 Java 语言 之 中 并 没有 使 用 预 处 理 器 ， 因 为 Java 语言 
天 然 的 编译 方式 (编译 器 并 非 一 个 一 个 地 编译 Java 文件 ， 而 是 将 所 有 的 编译 单元 的 语法 树 
顶级 节点 输入 到 待 处 理 列表 后 再 进行 编译 ， 因 此 各 个 文件 之 间 能 够 互相 提供 符号 信息 ) 无 须 
使 用 预 处 理 器 。 那 Java 语言 是 否 有 办 法 实现 条 件 编译 呢 ? 

Java 语言 当然 也 可 以 进行 条 件 编译 ， 方 法 就 是 使 用 条 件 为 常量 的 计 语句 。 如 演示 代码 
14-9 所 示 ， 此 代码 中 的 if 语句 不 同 于 其 他 Java 代码 ， 它 在 编译 阶段 就 会 被 “运行 ”， 生 
成 的 字 节 码 之 中 只 包括 “System.outprintln(”block 1”); ”一 条 语句 ， 并 不 会 包含 让 语句 
及 另外 一 个 分 子 中 的 “System.out.println(“block 27):”。 

演示 代码 14-9 


public static void main(String[] args) { 
if (true) { 
System.out.println ( "block 1ii); 


} else { 
System.out.println ( "block 2 ") :; 
} 
} 


此 代码 编译 后 Class 文件 的 反 编译 结果 : 


public static void main(String[] args) { 
System.out .println( "block 1°'i); 
} 


只 能 使 用 条 件 为 常量 的 if 语句 才能 达到 上 述 效果 ， 如 果 使 用 常量 与 其 他 带 有 条 件 判断 
能 力 的 语句 搭配 ， 则 可 能 在 控制 流 分 析 中 提示 错误 ， 被 拒绝 编译 ， 如 演示 代码 14-10 所 示 
的 代码 就 会 被 编译 器 拒绝 编译 ， 演 示 代 码 14-10 不 能 使 用 其 他 条 件 语 句 来 完成 条 件 编译 。 
演示 代码 14-10 


public static void main (String[] args) { 
// 编 译 器 将 会 提示 "Unreachable code" 
while (false) { 
System.out.println('''') ; 
} 


Java 语言 中 条 件 编译 的 实现 ， 也 是 Java 语言 的 一 颗 语法 糖 ， 根 据 布尔 常量 值 的 真 假 ， 
编译 器 将 会 把 分 支 中 不 成 立 的 代码 块 消除 掉 ， 这 一 工作 将 在 编译 器 解除 语法 糖 的 阶段 
(com.sun.tools.javac.comp.Lower 类 中 ) 完 成 。 由 于 这 种 条 件 编译 的 实现 方式 使 用 了 站 语句 ， 
所 以 它 必 须 遵循 最 基本 的 Java 语法 ， 只 能 写 在 方法 体内 部 ， 因 此 它 只 能 实现 语句 基本 块 
( Block) 级 别 的 条 件 编译 ， 而 没有 办 法 实现 根据 条 件 调整 整个 Java 类 的 结构 。 

除了 本 节 中 介绍 的 泛 型 、 自 动 装 箱 、 自 动 拆 箱 、 遍 历 循 环 、 变 长 参数 和 条 件 编译 之 
外 ，Java 语言 还 有 不 少 其 他 的 语法 糖 ， 如 内 部 类 、 枚 举 类 、 断 言语 句 、 对 枚 举 和 字符 串 (在 
JDK 1.7 中 支持 ) 的 switch 支持 、 在 try 语句 中 定义 和 关闭 资源 (在 JDK 1.7 中 支持 ) 等 ， 你 可 
以 通过 跟踪 Javac 源码 、 反 编译 Class 文件 等 方式 了 解 他 们 的 本 质 实现 。 
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14.5 ”插入 式 注解 处 理 器 


插入 式 注解 处 理 API(JSR 269) 提 供 一 套 标准 API 来 处 理 Annotations(JSR 175)， 是 从 
JDK 1.6 开始 推出 的 一 种 机 制 。 在 本 节 将 简单 介绍 插入 式 注解 处 理 API 的 基本 知识 ， 并 实 
战 演练 了 使 用 插入 式 注解 处 理 API 的 基本 过 程 。 


14.5.1 插入 式 注解 处 理 API 基础 


实际 上 JSR 269 不 仅仅 用 来 处 理 Annotation， 其 更 强大 的 功能 是 它 建立 了 Java 语言 
身 的 一 个 模型 ， 它 把 method、package、constructor、type、variable、enum、annotation 等 
Java 语言 元 素 映射 为 Types 和 Elements( 两 者 有 什么 区 别 ?)， 从 而 将 Java 语言 的 语义 映射 成 
为 对 象 ， 我 们 可 以 在 javax.lang.model 包 下 面 可 以 看 到 这 些 类 。 所 以 我 们 可 以 利用 JSR 269 
提供 的 API 来 构建 一 个 功能 丰富 的 元 编程 (Metaprogramming) 环 境 。JSR 269 用 Annotation 
Processor 在 编译 期 间 而 不 是 运行 期 间 处 理 Annotation，Annotation Processor 相当 于 编译 器 
的 一 个 插件 ， 所 以 称 为 插入 式 注解 处 理 。 如 果 Annotation Processor 处 理 Annotation 时 ( 执 
行 process 方法 ) 产 生 了 新 的 Java 代码 ， 编 译 器 会 再 调用 一 次 Annotation Processor， 如 果 第 
二 次 处 理 还 有 新 代码 产生 ， 就 会 接着 调用 Annotation Processor， 直 到 没有 新 代码 产生 为 
止 。 每 执行 一 次 process() 方 法 被 称 为 一 个 “round”， 这 样 整 个 Annotation processing 过 程 
可 以 看 作 是 一 个 round 的 序列 。JSR 269 主要 被 设计 成 为 针对 Tools 或 者 容器 的 API。 举 个 
例子 ， 我 们 想 建 立 一 套 基于 Annotation 的 单元 测试 框架 (如 TestNG)， 在 测试 类 里 面 用 
Annotation 来 标识 测试 期 间 需要 执行 的 测试 方法 如 下 : 

QTestMethod 

public void testCheckName (){ 
//do something here 

这 时 我 们 就 可 以 用 JSR 269 提供 的 API 来 处 理 测 试 类 ， 根 据 Annotation 提取 出 需要 执 
行 的 测试 方法 。 

另 一 个 例子 是 如 果 我 们 出 于 某 种 原因 需要 自行 开发 一 个 符合 Java EE 5.0 的 Application 
Server( 当 然 不 建议 这 样 做 )， 我 们 就 必须 处 理 Common Annotations(JSR 250)、Web Services 
Metadata(JSR 181) 等 规范 的 Annotations， 这 时 可 以 用 JSR 269 提供 的 API 来 处 理 这 些 
Annotations。 在 现在 的 开发 工具 里 面 ，Eclipse 支持 JSR 269。 

下 面 演示 如 何 来 用 JSR 269 提供 的 API 来 处 理 Annotations 和 读 取 Java 源 文件 的 元 数 
据 (Metadata)。 


@supportedaAnnotationTypes ("PluggableAPT.ToBeTested") // 可 以 用 "*" 表 示 支 持 所 有 
Annotations 
@sSupportedSourceVersion (SourceVersion.RELEASE 6) 
public class MyAnnotationProcessor extends AbstractProcessor { 
private void note (String msg) { 
processingEnv.getMessager () .printMessage (Diagnostic.Kind.NOTE, msg); 


和 asia 这 


和 安全 的 最 优 方案 


public boolean process (Set<? extends TypeElement> annotations, 
RoundEnvironment roundEnv) { 
//annotations 的 值 是 通过 esupportedannotationTypes 声明 的 且 目 标 源 代码 拥有 
的 所 有 Annotations 
for (TypeElement te:annotations){ 
note ("annotation:"+te.tostring()); 


E 
Set<? extends Element> elements = roundEnv.getRootElements();// 获 
取 源 代码 的 映射 对 象 
for ( Element e:elements){ 
// 获 取 源 代码 对 象 的 成 员 
List<? extends Element> enclosedElems = 
e.getEnclosedElements (); 
// 留 下 方法 成 员 , 过 滤 掉 其 他 成 员 
List<? extends ExecutableElement> ees = 
ElementFilter.methodsIn (enclosedElems); 
for (ExecutableElement ee:ees){ 
note("--ExecutableElement name is "+ee.-getSimpleName ()); 
List<? extends AnnotationMirror> as = 
ee .getAnnotationMirrors () ;// 获 取 方 法 的 Annotations 
note("--as="+as); 
for (AnnotationMirror am:as){ 
// 获 取 Annotation 的 值 
Map<? extends ExecutableElement, ? extends 
AnnotationValue> map= am.getElementValues (); 
Set<? extends ExecutableElement> ks = map.keySset (); 
for (ExecutableElement k:ks){// 打 印 Annotation 的 每 个 值 
AnnotationValue av = map.get (Kk); 
note("-——— 
"+ee.getSimpleName ()+"."+k.getSimpleName ()+"="+av.getValue ()); 
} 
} 
} 
. 
return false; 
} 
} 
@Retention (RetentionPolicy .RUNTIME) 
@Target (ElementType .METHOD) 
@interface ToBeTested{ 
String owner() default "Chinajash"; 
string group(); 
} 


编译 以 上 代码 ， 然 后 再 创建 下 面 的 Testing 对 象 ， 不 要 编译 Testing 对 象 。 


public class Testingt{ 
QToBeTested (group="A") 
public void ml(){ 
: 
@ToBeTested (group="B", owner="QQ") 
public void m2(){ 
} 
@PostConstruct//Common Annotation 里 面 的 一 个 Annotation 
public void m3(){ 
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| 
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下 面 用 以 下 命令 来 编译 Testing 对 象 : 


javac -XprintRounds -processor PluggableAPT.MyAnnotationProcessor Testing.java 


-XprintRounds 表示 打印 round 的 次 数 ， 运 行 上 面 命令 后 在 控制 台 会 看 到 如 下 输出 : 


Round 1: 
input files: {PluggableAPT.Testing} 
annotations: [PluggableAPT.ToBeTested, 
javax.annotation.PostConstruct] 
last round: false 
Note: annotation:PluggableAPT.ToBeTested 


Note: --ExecutableElement name is ml 
Note: --as=@PluggableAPT.ToBeTested (group="R") 
Note: ----ml.group=A 
Note: --ExecutableElement name is m2 
Note: --as=@PluggableAPT.ToBeTested (group="B", owner="QQ") 
Note: ----m2.group=B 
Note: ----m2 .owner=QQ 
Note: --ExecutableElement name is m3 
Note: --as=@javax.annotation.PostConstruct 
Round 2: 
input files: {} 
annotations: [] 


last round: true 


通过 阅读 Javac 编译 器 的 源码 ， 我 们 知道 编译 器 在 把 Java 程序 源码 编译 为 字 节 码 的 时 
候 ， 会 对 Java 程序 源码 做 各 方面 的 检查 校 验 。 这 些 校 验 主要 以 程序 “ 写 得 对 不 对 ”为 出 发 
点 ， 虽 然 也 有 各 种 WARNING 的 信息 ， 但 总 体 来 讲 还 是 较 少 去 校 验 程 序 “ 写 得 好 不 好 ”。 
有 鉴于 此 ， 业 界 出 现 了 许多 针对 程序 “ 写 得 好 不 好 ”的 辅助 校 验 工具 ， 如 CheckStyle、 
FindBug、Klocwork 等 。 这 些 代码 校 验 工具 有 一 些 是 基于 Java 的 源码 进行 校 验 ， 有 一 些 是 
通过 扫描 字 节 码 来 完成 ， 在 本 节 的 实战 中 ， 我 们 将 会 使 用 注解 处 理 器 API 来 编写 一 款 拥有 
自己 编码 风格 的 校 验 工 具 NameCheckProcessor。 

当然 ， 由 于 我 们 的 实战 都 是 为 了 学 习 和 演示 技术 原理 ， 而 不 是 为 了 做 出 一 款 能 媲美 
CheckStyle 等 工具 的 产品 来 ， 所 以 NameCheckProcessor 的 目标 也 仅 定 为 对 Java 程序 命名 
进行 检查 ， 根 据 《Java 语言 规范 》 中 的 要 求 ，Java 程序 命名 应 当 符 合 下 列 格式 的 书写 


规范 : 
口 ”类 (或 接口 ): 符合 驼 式 命名 法 ， 首 字母 大 写 。 
口 方法 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 
口 “字段 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 
口 ” 类 或 实例 变量 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 
口 常量: 要 求全 部 由 大 写字 母 或 下 划 线 构成 ， 并 且 第 一 个 字符 不 能 是 下 划 线 。 


上 文 提 到 的 驼 式 命名 法 (Camel Case Names)， 正 如 它 的 名 称 所 表示 的 那样 ， 是 指 混合 
使 用 大 小 写字 母 来 分 割 构成 变量 或 函数 的 名 字 ， 犹 如 驼峰 一 般 ， 这 是 当前 Java 语言 中 主流 
的 命名 规范 ， 我 们 的 实战 目标 就 是 为 Javac 编译 器 添加 一 个 额外 的 功能 ， 在 编译 程序 时 检 
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查 程序 名 是 否 符合 上 述 对 类 (或 接口 )、 方 法 、 字 段 的 命名 要 求 。 


14.5.2 ”实战 


要 通过 注解 处 理 API 实现 一 个 编译 器 插件 ， 首 先 需 要 了 解 这 组 API 的 一 些 基 本 知识 。 
我 们 实现 注解 处 理 器 的 代码 需要 继承 抽象 类 javax.annotation .processing.AbstractProcessor， 
这 个 抽象 类 中 只 有 一 个 必须 覆盖 的 abstract 方法 “process()”， 它 是 Javac 编译 器 在 执行 注 
解 处 理 器 代码 时 要 调用 的 过 程 ， 我 们 可 以 从 这 个 方法 的 第 一 个 参数 “annotations” 中 获取 
到 此 注解 处 理 器 所 要 处 理 的 注解 集合 ， 从 第 二 个 参数 “roundEnv” 中 访问 到 当前 这 个 
Round 中 的 语法 树 节 点 ， 每 个 语法 树 节点 在 这 里 表示 为 一 个 Element。 在 JDK 1.6 新 增 的 
javax.lang.model 包 中 定义 了 16 类 Element， 包 括 了 Java 代码 中 最 常用 的 元 素 ， 例 如 “ 包 
(PACKAGE) 、 枚 举 (ENUM) 、 类 (CLASS) 、 注 解 (ANNOTATION TYPE) 、 接 口 
(INTERFACE)、 枚 举 值 (ENUM_CONSTANT)、 字 段 (FIELD)、 参 数 (PARAMETER)、 本 地 
变量 (LOCAL VARIABLE)、 异 常 (EXCEPTION PARAMETER)、 方 法 (METHOD)、 构 造 
函数 (CONSTRUCTOR)、 静 态 语句 块 (STATIC INIT， 即 static{} 块 )、 实 例 语句 块 
(NSTANCE 一 INIT， 即 分 块 )、 参 数 化 类 型 (TYPE 一 PARAMETER， 即 泛 型 尖 括 号 内 的 类 
型 ) 和 未 定义 的 其 他 语法 树 节点 (OTHER)”。 除 了 process() 方 法 的 传 入 参数 之 外 ， 还 有 一 个 
很 常用 的 实例 变量 “processingEnv”， 它 是 AbstractProcessor 中 的 一 个 protected 变量 ， 在 
注解 处 理 器 初始 化 的 时 候 (init() 方 法 执行 的 时 候 ) 创 建 ， 继 承 了 AbstractProcessor 的 注解 处 
理 器 代码 可 以 直接 访问 到 它 。 它 代表 了 注解 处 理 器 框架 提供 的 一 个 上 下 文 环境 ， 要 创建 新 
的 代码 、 向 编译 器 输出 信息 、 获 取 其 他 工具 类 等 都 需要 用 到 这 个 实例 变量 。 

注解 处 理 器 除了 process() 方 法 及 其 参数 之 外 ， 还 有 两 个 可 以 配合 使 用 的 Annotations: 
@SupportedAnnotationTypes 和 人 @SupportedSourceVersion， 前 者 代表 了 这 个 注解 处 理 器 对 哪 
些 注解 感 兴趣 ， 可 以 使 用 星 号 “ 木 ” 作 为 通配符 代表 对 所 有 的 注解 都 感 兴趣 ， 后 者 指出 这 
个 注解 处 理 器 可 以 处 理 哪 些 版 本 的 Java 代码 。 

每 一 个 注解 处 理 器 在 运行 的 时 候 都 是 单 例 的 ， 如 果 不 需要 改变 或 生成 语法 树 的 内 容 ， 
process0 方 法 就 可 以 返回 一 个 值 为 false 的 布尔 值 ， 通 知 编译 器 这 个 Round 中 的 代码 未 发 生 
变化 ， 无 需 构造 新 的 JavaCompiler 实例 ， 在 这 次 实战 的 注解 处 理 器 中 只 对 程序 命名 进行 检 
查 ， 不 需要 改变 语法 树 的 内 容 ， 因 此 process() 方 法 的 返回 值 都 是 false。 关 于 注解 处 理 器 的 
API， 笔 者 就 简单 介绍 这 些 ， 对 这 个 领域 有 兴趣 的 读者 可 以 阅读 相关 的 帮助 文档 。 我 们 来 
看 看 注解 处 理 器 NameCheckProcessor 的 具体 代码 ， 如 演示 代码 14-11 所 示 。 

演示 代码 14-11 


@sSupportedAnnotationType t3 { " *"™) 
@supportedSourceVersion ( SourcaVersion . RELEASE 6 
public class NameCheckProcessor extends AbstractProcessor { 


private NameChecker nameChecker; 
@Override 
public void init(ProcessingEnvironment processingEnv) { 
super.init (processingEnv) ; 
nameChecker = new NameChecker{processingEnv) ; 


人 
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: 


@Over ride 
public boolean process (Set<'1 extends TypeElement> annotationa, 


RoundEnvironment roundEnv) { 
if (lroundEnv.processingOrrer ()) { 
for (Element element : roundEnv.getRootElements()) 
nameChecker. checkNames 


( alement) ; 
return ea 

} 

从 上 面 的 代码 可 以 看 到 NameCheckProcessor 能 处 理 基 于 JDK 1.6 的 源码 ， 它 不 限于 特 


定 的 注解 ， 对 任何 代码 都 “ 感 兴趣 ”， 而 在 process() 方 法 中 是 把 当前 Round 中 的 每 一 个 
RootElement 传递 到 一 个 名 为 NameChecker 的 检查 器 中 执行 名 称 检查 逻辑 ，NameChecker 


的 代码 如 演示 代码 14-12。 
演示 代码 14-12 


public class NameChecker { 
private final Messager messager; 
NameCheckScanner nameCcheckScanner = new NameCheckScanner() ; 

NameChecker (ProcessingEnvironment processsingEnv) { 
this.messager = processsingEnv.getMessager() ; 
} 

public void checkNames (Element element) { 
nameCheckScanner. 


scan ( element) ; 


} 
private class NameCheckScanner extends ElementScanner6<Void, Void> 


{ 


@Override 
public Void visitType (TypeElement e, Void p) { 
scan (e.getTypeParameters ( ) ， Pp) : 


checkCamelCase (e, true) ; 
super.visitType (e, p); 
return null; 


} 


public Void visitExecutable (ExecutableElement e, Void p) { 


if (e.getKind() == METHOD) { 
Name name = e.getSimpleName () ; 
(name. contentEquals (e .getEnclosingElement 


Q@Override 


主 毛 
( ) .getsimpleName ( ) ) ) 
messager.printMessage (WARNING, " — iKik- "" + name + 
1 芝 耻 下 
~ TIT = Lot kolto edten. 23 下 
二 
1 
checkCamelCase (e, false) ; 


} 
super.visitExecutable (e, p); 


return null; 


@Override 


六 ED 


匀 从 Jovi 并 发 
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public Void visitVariable (VariableElement e, Void p) { 


if (e.getKind() == ENUM CONSTANT 1I e.getConstantValue () 1= 
EU 
heuristicallyConstant (e) ) 
checkAllCaps (e) ; 
else 


checkCamelCase (e, false) ; 
return null; 
} 
private boolean heuristicallyConstant (VariableElement e) { 


if (e.getEnclosingElement () .getKind() == INTERFACE). 
return true; 
else if (e.getKind() == FIELD && 


e.getModifiers() .containsAll (EnumSet. 
of (PUBLIC, STATIC, FINAL) ) ) 
return true, 
else { 
return false; 
下 
} 
private void checkCamelCase (Element e. boolean initialCaps) { 
String name = e.getsimpleName () .toString () ; 
bodlean previousUpper = false; 
boolean conventional = true; 
int firstCodePoint = name.codePointat (0) ， 
if (Character.isUpperCase (firstCodePoint) ) { 
previousUpper = true; 
if {!initialCaps) { 
messager.printMessage (WARNING, " .gxtS " "+ name + "" ,8t 
DT 
EI) 
return; 
} 
} else if (Character.isLowerCase (firstCodePoint)) { 
if (initialCaps) { 


messager.printMessage (WARNING. " .9-f*: "" + name + ""E& 
WA+\:n 
二 下 = 志 we GOX 二 
return, 
} 
} else 


conventional = false; 
if (conventional) { 

int cp = firstCodePoint; 

for (int i = Character.charCount (cp) ; i < name.length(); i 

+Z 
Character -charCount (cp) ) { 
cp = name.codePointAt (i) ; 
if (Character.isUpperCase (cp) ) { 
if (previousUpper) { 
. Conventional = false; 
break ; 
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previousUpper = true; 
} else 
previousUpper = false; 
3 
} 
和 ( ! conventional) 
messager.printMessage (WARNING, " )9+f. "" + name + "" Lal 
~t~~e=1.4~.91L— 
(Camel Case Names) ", e); 
} 
private void checkAllCaps (Element e) { 
String name = e.getSimpleNarTie () .tostring () ; 
boolean conventional = true; 
int firstCodePoint = name.codePointAt (0) ; 
if ( ! Character.isUpperCase 
( firstCodePoint) ) 
conventional = false; 
else { 
boolean previousUnderscore = false; 
int cp = firstCodePoint; 
for (int i = Character.charCount(cp) ; i < name.length(); 
4 
Character.charCount (cp) ) { 
cp = name.codePointAt (i) ; 
Mi Rs boa Op 
if (previousUnderscore) { 
conventional = false; 
break; 
} 


previousUnderscore = true; 
} else { 
previousUnderscore = false; 
if ( !Character.isUpperCase (cp) && !Character.isDigit 
(cp) ){ 
conventional = false; 
break; 
} 
} 
} 
} 
各 ( ! conventional) 
messager .printMessage (WARNING,， "常量 " + name + 
" "应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 ",e) ，; 
} 
} 
} 


NameChecker 的 代码 看 起 来 有 点 长 ， 但 实际 上 注释 占 了 很 大 一 部 分 ， 而 且 即 使 算 上 注 
释 也 不 到 190 行 。 它 通过 一 个 继承 于 javax.lang mo delutiLElementS canner6 的 NameCheck 
Scanner 类 ， 以 Visitor 模式 来 完成 对 语法 树 的 遍历 ， 分 别 执行 visitType()、visitVariable() 和 
VisitExecutable() 方 法 来 访问 类 、 字 段 和 方法 ， 这 3 个 visit 方法 对 各 自 的 命名 规则 做 相应 的 
检查 ，checkCamelCase() 与 checkAIICaps() 方 法 则 用 于 实现 驼 式 命名 法 和 全 大 写 命名 规则 的 
检查 。 


a p> 
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整个 注解 处 理 器 只 需 NameCheckProcessor 和 NameChecker 两 个 类 就 可 以 全 部 完成 ， 
为 了 验证 我 们 的 实战 成 果 ， 在 下 面 的 代码 中 提供 了 一 段 命 名 规范 的 “反面 教材 ”代码 ， 其 
中 的 每 一 个 类 、 方 法 及 字段 的 命名 都 存在 问题 ， 但 是 使 用 普通 的 Javac 编译 这 段 代 码 时 不 
会 提示 任意 一 个 Waming 信息 。 


public class BADLY NAMED CODE { 
enum colors { 
red, blue, green; 
| 
static final int FORTY TWO = 42; 
public static int NOT A CONSTANT = FORTY TWO; 
protected void BADLY NAMED CODE() { 
return; 
} 
public void NOTcamelCASEmethodNAME() { 
return; 
J 


接 下 来 开始 运行 并 测试 前 面 的 程序 。 我 们 可 以 通过 Javac 命令 的 “-processor” 参 数 来 
执行 编译 时 需要 附带 的 注解 处 理 器 ， 如 果 有 多 个 注解 处 理 器 的 话 ， 用 逗号 分 隔 。 还 可 以 使 
用 -XprintRounds 和 -XprintProcessorInfo 参数 来 查看 注解 处 理 器 运作 的 详细 信息 ， 本 次 实战 
中 的 NameCheckProcessor 的 编译 及 执行 过 程 如 下 。 


D: \ src >j avac org/fenixsoft/compile/NameChecker . j ava 
D : \src >j avac org/fenixsoft/compile/NameCheckProcessor . j ava 
D:\src>javac -processor org.fenixsoft .compile.NameCheckProcessor 
org/fenixsoft/ 
compile/BADLY NAMED CODE . java 
org\ fenixsoft\compile\BADLY NAMED CODE . java: 3 : ot 
n BADLY NAMED CODE " EL % .ff g 
gtl:A4~.9ib (Camel Case Names) 
public class BADLY NAMED CODE { 
A 
org\ fenixsoft \compile\BADLY NAMED CODE . java: 5 : %% : k+i: 
ee 
enum colors { 


A 
Org\ fenixsoft \compile\BADLY NAMED CODE . java : 6 : $%4- ~jt " 
red" b4F VX k:~ %-&-iTXi] 


t~4y-g ， +lLvX q-{kif'91 
red, blue, green, 
A 
org\fenixsoft\compile\BADLY NAMED CODE.java:6: y~-: $'f "blue" 
FvXk:nk~T 
3V]1X4it-g, +lI~vXq-itjt9, 
red, blue, green; 
A 
org\ fenixsoft\compile\BADLY NAMED CODE . java: 6 : ~- 一 
Myroenm lS me AE VA KE SEA 殉 
3i}l~4~-g, if- EL},X~~g:it9~ 
Ted; blne greens 
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org\ fenixsoft \compile\BADLY NAMED CODE . java : 9 : Wh 
FORTY TWO " 1]t gx ~4F r-A k k'q- 
-8: alT3cijl#e4~-9 , if- a.vX 719:if-9; 
static final int FORTY TWO = 42; 


A 
org\ f£ enixsoft \ compile \BADLY NAMED CODE . java :11: 51:4- 
; h -fl: u NOT A CONSTANT ” )tjL % vA ,J-:~ 
s~:jf- 91 
public static int NOT A CONSTANT = FORTY TWO; 
A 
org\ fenixsoft \compile\BADLY NAMED CODE. java :13 : f% : hti: 


"Test " BQi vx,J.:nk-lt 3k 
protected void Test () { 
A 
org\fenixsoft\compile\BADLY NAMED CODE.java:17: +4- : hk 
"NOoTcamelCASEmethodNAME" 
EL b vX,J- :~ q~:jr- ik 


public void NOTcamelCASEmethodNAME() f£ 


NameCheckProcessor 的 实战 例子 只 演示 了 JSR-269 嵌入 式 注解 处 理 API 其 中 的 一 部 分 
功能 ， 基 于 这 组 API 支持 的 项 目 还 有 用 于 校 验 Hibermate 标签 使 用 正确 性 的 Hibemate 
Validator Annotation Processor( 本 质 上 与 NameCheckProcessor 所 做 的 事情 差不多 )、 自 动 为 
字段 生成 getter 和 setter 方法 的 Project Lombok( 根 据 已 有 元 素 生成 新 的 语法 树 元 素 ) 等 ， 读 
者 有 兴趣 的 话 可 以 参考 它们 官方 站 点 的 相关 内 容 。 
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上 一 章 讲解 了 编译 优化 的 基本 知识 。 本 章 将 进一步 讲解 Java 技术 的 优化 
知识 ， 详 细 讲解 JVM 在 程序 运行 时 期 的 优化 技术 方案 ， 为 读者 学 习 后 面 的 知识 
打下 基础 。 


是 后 符 ,sse 机 下 
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15.1 运行 期 优化 简介 


Java 编程 语言 是 一 种 新 的 具有 独特 性 能 特征 的 编程 语言 。 迄 今 为 止 ， 大 部 分 试图 提高 
其 性 能 的 尝试 都 集中 在 如 何 应 用 为 传统 语 言 开发 的 编译 技术 上 。 及 时 编译 器 是 基本 的 快 
速 传统 编译 器 ， 它 可 以 “在 运行 中 ”将 Java 字 节 码 转换 为 本 地 机 器 代码 。 及 时 编译 器 在 终 
端 用 户 的 实际 执行 字 节 码 的 机 器 上 运行 ， 并 编译 每 一 个 被 首次 执行 的 方法 。 

在 部 分 的 商用 虚拟 机 (Sun HotSpot、IBM J9) 中 ，Java 程序 最 初 是 通过 解释 器 (Interpreter) 
进行 解释 执行 的 ， 当 虚拟 机 发 现 某 个 方法 或 代码 块 的 运行 特别 频繁 ， 就 会 把 这 些 代码 认定 
为 “热点 代码 ”(Hot Spot Code)， 为 了 提高 热点 代码 的 执行 效率 ， 在 运行 时 ， 虚 拟 机 将 会 
把 这 些 代码 编译 成 与 本 地 平台 相关 的 机 器 码 ， 并 进行 各 种 层次 的 优化 ， 完 成 这 个 任务 的 编 
译 器 称 为 即时 编译 器 (Just In Time Compiler， 下 文中 简称 JIT 编译 器 )。 

即时 编译 器 并 不 是 虚拟 机 必需 的 部 分 ，Java 虚拟 机 规范 并 没有 规定 Java 虚拟 机 内 必须 
要 有 即时 编译 器 ， 更 没有 限定 或 指导 即时 编译 器 应 该 如 何 去 实 现 。 但 是 ， 即 时 编译 器 编译 
性 能 的 好 坏 、 代 码 优 化 程度 的 高 低 却 是 衡量 一 款 商 用 虚拟 机 优秀 与 否 的 最 关键 的 指标 之 
一 ， 它 也 是 虚拟 机 中 最 核心 最 能 体现 技术 水 平 的 部 分 。 在 本 章 中 ， 我 们 将 走 进 虚拟 机 的 内 
部 ， 探 索 即时 编译 器 的 运作 过 程 。 

由 于 Java 虚拟 机 规范 没有 具体 的 约束 规则 去 限制 即时 编译 器 应 该 如 何 实现 ， 所 以 这 部 
分 功能 完全 是 与 虚拟 机 具体 实现 (Implementation Specific) 相 关 的 内 容 ， 如 无 特殊 说 明 ， 本 
章 中 所 提 及 的 编译 器 、 即 时 编译 器 都 是 指 HotSpot 虚拟 机 内 的 即时 编译 器 ， 虚 拟 机 也 是 特 
指 HotSpot 虚拟 机 。 不 过 ， 本 章 中 的 大 部 分 内 容 是 描述 即时 编译 器 的 行为 ， 涉 及 编译 器 实 
现 层面 的 内 容 较 少 ， 而 主流 虚拟 机 中 即时 编译 器 的 行为 又 有 很 多 相似 相通 之 处 ， 因 此 对 其 
他 虚拟 机 来 说 也 具备 较 大 的 参考 意义 。 


15.2 ”HotSpot 虚拟 机 内 的 即时 编译 器 


在 本 节 的 内 容 中 ， 我 们 将 要 了 解 HotSpot 虚拟 机 内 的 即时 编译 器 的 运作 过 程 ， 同 时 ， 
我 们 要 解决 以 下 几 个 问题 : 
口 “ 为 何 HotSpot 虚拟 机 要 使 用 解释 器 与 编译 器 并 存 的 架构 ? 
为 何 HotSpot 虚拟 机 要 实现 两 个 不 同 的 即时 编译 器 ? 
程序 何 时 使 用 解释 器 执行 ? 何 时 使 用 编译 器 执行 ? 
哪些 程序 代码 会 被 编译 为 本 地 代码 ? 如 何 编译 本 地 代码 ? 
如 何 从 外 部 观察 即时 编译 器 的 编译 过 程 和 编译 结果 ? 


15.2.1 HotSpot 虚拟 机 的 背景 
在 JIT 编译 中 存在 着 几 个 问题 。 首 先 ， 由 于 编译 器 是 在 “用 户 时 间 ” 内 运行 于 执行 字 


人 
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节 码 的 机 器 上 ， 因 此 它 将 受到 编译 速度 的 严格 限制 : 如 果 编 译 速度 不 是 特别 快 ， 则 用 户 将 
会 感到 在 程序 的 启动 或 某 一 部 分 的 明显 的 延迟 。 这 就 不 得 不 采取 一 种 折 中 方案 ， 用 这 种 折 
中 方案 将 很 难 进行 最 好 的 优化 ， 从 而 将 会 大 大 地 降低 编译 性 能 。 

其 次 ， 即 使 IT 有 时 间 进 行 全 优化 ， 这 样 的 优化 对 Java 编程 语言 来 说 ， 也 比 对 传统 语 
言 (如 C 和 C++) 的 优化 效果 要 差 。 这 有 以 下 几 个 原因 。 

(1) Java 编程 语言 是 动态 “安全 的 ”， 其 含义 是 保证 程序 不 违反 语言 的 语义 或 直接 访 
问 非 结构 化 内 存 。 这 就 意味 着 必须 经 常 进行 动态 类 型 测试 ， 例 如 ， 当 转型 时 (Casting) 和 向 
对 象 数组 进行 存储 时 。 

(2) Java 编程 语言 在 “ 堆 (heap)” 上 对 所 有 对 象 进行 分 配 ， 而 在 C++ 中 ， 许 多 对 象 是 在 
栈 (Stack) 上 分 配 的 。 这 就 意味 着 Java 编程 语言 的 对 象 分 配 效率 比 C++ 的 对 象 分 配 效率 要 高 
得 多 。 除 此 之 外 ， 由 于 Java 编程 语言 是 垃圾 回收 式 的 ， 因 而 它 比 C++ 有 更 多 的 不 同类 型 的 
内 存 分 配 开销 (包括 潜在 的 垃圾 清理 (Scavenging) 和 编写 -隔离 (Write-barrienD 开 销 )。 

(3) 在 Java 编程 语言 中 ， 大 部 分 方法 调用 是 “虚拟 的 ”( 潜 在 是 多 态 的 )， 这 在 C++ 中 
很 少见 。 这 不 仅 意味 着 方法 调用 的 性 能 更 重要 ， 而 且 意味 着 更 难以 为 方法 调用 而 执行 静态 
编译 器 优化 (特别 是 像 内 峰 方 法 (Inlining) 那 样 的 全 局 优化 )。 大 多 数 传统 优化 在 调用 之 间 是 
最 有 效 的 ， 而 Java 编程 语言 中 的 减 小 的 调用 间距 离 可 大 大 降低 这 种 优化 的 效率 ， 这 是 因为 
它们 使 用 了 较 小 的 代码 段 的 缘故 。 

(4) 基于 Java 技术 的 程序 由 于 其 强大 的 动态 类 装载 的 能 力 ， 因 而 可 “在 运行 中 ”发 生 
改变 。 这 就 使 得 它 特别 难于 进行 许多 类 型 的 全 局 优化 ， 因 为 编译 器 不 仅 必须 能 够 检测 这 些 
优化 何 时 会 由 于 动态 装载 而 无 效 ， 而 且 还 必须 能 够 在 程序 执行 过 程 中 解除 和 /或 重 做 这 些 优 
化 ， 且 不 会 以 任何 形式 损坏 或 影响 基于 Java 技术 的 程序 的 执行 语义 (即使 这 些 优化 涉及 栈 
上 的 活动 方法 )。 

上 述 问 题 的 结果 是 使 得 任何 试图 获取 Java 编程 语言 的 先进 性 能 的 尝试 ， 都 必须 寻求 一 
种 非 传统 的 解决 方案 ， 而 不 是 盲目 地 应 用 传统 编译 器 技术 。Java HotSpot 性 能 引擎 的 体系 
结构 通过 使 用 适 配 性 的 优化 技术 ， 解 决 了 以 上 所 提出 的 Java 编程 语言 的 性 能 问题 。 适 配 性 
的 优化 技术 是 Sun 公司 的 研究 机 构 Self 小 组 多 年 以 来 在 面向 对 象 的 语言 实现 上 的 研究 
成 果 。 


1. 热点 Hot Spot 检测 


适 配 性 的 优化 技术 利用 了 大 多 数 程序 的 有 趣 的 属性 ， 解 决 了 JIT 编译 问题 。 实 际 上 ， 
所 有 程序 都 是 花费 了 它们 的 大 部 分 时 间 而 执行 了 它们 中 的 很 小 一 部 分 代码 。Java HotSpot 
性 能 引擎 不 是 在 程序 一 启动 时 就 对 整个 程序 进行 编译 ， 而 是 在 程序 一 启动 时 就 立即 使 用 解 
释 器 (Interpreter) 运 行 该 程序 ， 在 运行 中 对 该 程序 进行 分 析 以 检测 程序 中 的 关键 性 “热点 
(Hot Spot)”， 然 后 ， 再 将 全 局 本 地 码 (Native-code) 优 化 器 集中 在 这 些 热 点 上 。 通 过 避免 编 
译 (大 部 分 程序 的 ) 不 常 执行 的 代码 ，Java HotSpot 编译 器 将 更 多 的 注意 集中 于 程序 的 性 能 关 
键 性 部 分 ， 因 而 不 必 增 加 总 的 编译 时 间 。 这 种 动态 监测 随 着 程序 的 运行 而 不 断 进 行 ， 因 
而 ， 它 可 以 精确 地 “在 运行 中 ”调整 它 的 性 能 以 适应 用 户 的 需要 。 

这 种 方法 的 一 个 巧妙 而 重要 的 益处 是 ， 通 过 将 编译 延迟 到 代码 已 被 执行 一 会 儿 之 后 ， 
从 而 可 在 代码 被 使 用 的 过 程 中 收集 信息 ， 并 使 用 这 些 信息 进行 更 智能 的 优化 。 除 收集 程序 
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中 的 热点 信息 外 ， 也 收集 其 他 类 型 的 信息 ， 如 与 “虚拟 ”方法 调用 有 关 的 调用 者 -被 调用 
者 的 关系 数据 等 。 


2. 方法 内 获 


正 像 在 “背景 说 明 ” 中 所 提 到 的 ，Java 编程 语言 中 的 “虚拟 ”方法 调用 的 出 现 频率 ， 
是 一 个 重要 的 妨碍 优化 的 瓶颈 。 当 Java HotSpot 适 配 性 优化 器 在 执行 过 程 中 ， 一 旦 回收 了 
有 关 程序 “热点 ”的 信息 后 ， 它 不 仅 能 将 这 些 “热点 ”编译 为 本 地 代码 ， 而 且 还 可 以 执行 
内 慨 在 这 些 代码 上 的 大 量 的 方法 。 

内 嵌 具 有 重要 的 益处 。 它 极 大 地 减 小 了 方法 调用 的 动态 频率 ， 这 就 节省 了 执行 这 些 广 
法 调用 所 需要 的 时 间 。 而 更 重要 的 是 ， 内 堪 为 优化 器 生成 了 大 得 多 的 代码 块 。 这 种 状态 可 
以 大 大 地 提高 传统 编译 器 的 优化 技术 的 效率 ， 从 而 消除 提高 Java 编程 语言 性 能 的 障碍 。 

内 嵌 对 其 他 代码 的 优化 起 到 了 促进 作用 ， 它 使 优化 的 效率 大 大 提高 。 随 着 Java 
HotSpot 编译 器 的 进一步 成 熟 ， 操 作 更 大 的 内 嵌 代 码 块 的 能 力 将 使 实现 更 先进 的 优化 技术 
成 为 可 能 。 

3. 动态 逆 优 化 


尽管 上 述 内 嵌 是 一 种 非常 重要 的 优化 方法 ， 但 对 于 像 Java 编程 语言 那样 的 动态 的 面向 
对 象 的 编程 语言 来 说 ， 这 在 传统 上 一 直 是 非常 难以 实现 的 。 此 外 ， 尽 管 检测 “热点 ”和 内 
嵌 它 们 所 调用 的 方法 已 经 十 分 困难 ， 但 它 仍然 还 不 足以 提供 全 部 的 Java 编程 语言 的 语义 。 
这 是 因为 ， 用 Java 编程 语言 编写 的 程序 不 仅 能 够 “在 运行 中 ”改变 方法 调用 的 模式 ， 而 且 
能 够 为 一 个 运行 的 程序 动态 地 装载 新 的 Java 代码 。 

内 媒 是 基于 全 局 分 析 的 ， 动 态 装载 使 内 嵌 更 加 复杂 了 ， 因 为 它 改变 了 一 个 程序 内 部 的 
全 局 关系 。 一 个 新 的 类 可 能 包含 了 需要 被 内 嵌 在 适当 位 置 的 新 的 方法 。 所 以 ，Java HotSpot 
性 能 引擎 必须 能 够 动态 地 逆 优 化 (如 果 需 要 ， 然 后 再 重新 优化 ) 先 前 已 经 优化 过 的 “ 热 
点 ”， 甚 至 在 “热点 ”代码 的 执行 过 程 中 进行 这 种 操作 。 没 有 这 种 能 力 ， 一 般 的 内 婴 将 不 
能 在 基于 Java 的 程序 上 安全 地 执行 。 

4. 优化 编译 器 

只 有 性 能 关键 性 代码 才 被 编译 ， 这 就 “购买 了 时 间 ”， 并 可 将 这 些 时 间 用 于 更 好 的 优 
化 。Java HotSpot 性 能 引擎 使 用 全 优化 编译 器 ， 以 此 蔡 代 了 相对 简单 的 JIT 编译 器 。 全 优 
化 编译 器 可 执行 所 有 第 一 流 的 优化 。 例 如 : 死 代 码 删除 、 循 环 非 变量 的 提升 、 普 通 子 表达 
式 删 除 和 连续 不 断 的 传送 (Constant Propagation) 等 。 它 还 赋予 优化 某 些 特定 于 Java 技术 的 
性 能 。 如 : 空 -检查 (Null-check) 和 值 域 -检查 (Range-check) 删 除 等 。 寄 存 器 分 配 程 序 (Register 
Allocator) 是 一 个 用 颜色 表示 分 配 程 序 的 全 局 图 形 ， 它 充分 利用 了 大 的 寄存 器 集 (Register 
Sets)。Java HotSpot 性 能 引擎 的 全 优化 编译 器 的 移植 性 能 很 强 ， 它 依赖 相对 较 小 的 机 器 描 
述 文件 来 描述 目标 硬件 的 各 个 方面 。 尽 管 编译 器 采用 了 较 慢 的 JIT 标准 ， 但 它 仍然 比 传统 
的 优化 编译 器 要 快 得 多 。 而 且 ， 改 善 的 代码 质量 也 是 对 由 于 减少 已 编译 代码 的 执行 次 数 而 
节省 的 时 间 的 一 种 “回报 ”。 
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15.2.2 ”解释 器 与 编译 器 


尽管 并 不 是 所 有 的 Java 虚拟 机 都 采用 解释 器 与 编译 器 并 存 的 架构 ， 但 许多 主流 的 商用 
虚拟 机 ， 如 HotSpot、J 等 ， 都 同时 包含 解释 器 与 编译 器 ， 解 释 器 与 编译 器 两 者 各 有 优 
势 : 当 程 序 需 要 迅速 启动 和 执行 的 时 候 ， 解 释 器 可 以 首先 发 挥 作 用 ， 省 去 编译 的 时 间 ， 立 
即 执行 。 当 程序 运行 后 ， 随 着 时 间 的 推移 ， 编 译 器 逐渐 发 挥 作用 ， 把 越 来 越 多 的 代码 编译 
成 本 地 代码 之 后 ， 可 以 获取 更 高 的 执行 效率 。 当 程序 运行 环境 中 内 存 资源 限制 较 大 (如 部 分 
嵌入 式 系统 中 )， 可 以 使 用 解释 执行 节约 内 存 ， 反 之 可 以 使 用 编译 执行 来 提升 效率 。 同 时 ， 
解释 器 还 可 以 作为 编译 器 激进 优化 时 的 一 个 “逃生 门 ”， 让 编译 器 根据 概率 选择 一 些 大 多 
数 时 候 都 能 提升 运行 速度 的 优化 手段 ， 当 激进 优化 的 假设 不 成 立 ， 如 加 载 了 新 类 后 类 型 继 
承 结构 出 现 变 化 、 出 现 “ 罕 见 陷阱 ”(Uncommon Trap) 时 可 以 通过 逆 优 化 (Deoptimization) 退 
回 到 解释 状态 继续 执行 ， 部 分 没有 解释 器 的 虚拟 机 中 也 会 采用 不 进行 激进 优化 的 Cl 编译 
器 担任 “逃生 门 ” 的 角色 ， 因 此 在 整个 虚拟 机 执行 架构 中 ， 解 释 器 与 编译 器 经 常 是 相 辅 相 
成 地 配合 工作 的 ， 如 图 15-1 所 示 。 


解释 器 解释 器 
即时 编译 Client Compiler 
Interperter 
4 逆 优 化 Server Compiler 


15-1 ”解释 器 和 编译 器 之 间 的 交互 


HotSpot 虚拟 机 中 内 置 了 两 个 即时 编译 器 ， 称 为 Client Compiler 和 Server Compiler， 
或 者 简称 为 Cl 编译 器 和 C2 编译 器 (也 叫 Opto 编译 器 )。 目 前 主流 的 HotSpot 虚拟 机 中 (Sun 
系列 JDK 1.6 及 之 前 版 本 的 虚拟 机 )， 默 认 是 采用 解释 器 与 其 中 一 个 编译 器 直接 配合 的 方式 
工作 ， 程 序 使 用 哪个 编译 器 ， 取 决 于 虚拟 机 运行 的 模式 ，HotSpot 虚拟 机 会 根据 自身 版 本 
与 宿主 机 器 的 硬件 性 能 自动 选择 运行 模式 ， 用 户 也 可 以 使 用 -client 或 -server 参数 去 强制 指 
定 虚拟 机 运行 在 Client 模式 还 是 Server 模式 。 

无 论 采 用 的 编译 器 是 Client Compiler 还 是 Server Compiler， 解 释 器 与 编译 器 搭配 使 用 
的 方式 在 虚拟 机 中 被 称 为 “混合 模式 ”(Mixed Mode)， 用 户 可 以 使 用 参数 -Xint 强制 虚拟 机 
运行 于 “解释 模式 ”(Interpreted Mode)， 这 时 候 编译 器 完全 不 介入 工作 ， 全 部 代码 都 使 用 
解释 方式 执行 。 另 外 ， 也 可 以 使 用 参数 -Xcomp 强制 虚拟 机 运行 于 “编译 模式 ”(Compiled 
Mode)， 这 时 候 将 优先 采用 编译 方式 执行 程序 ， 但 是 解释 器 仍然 要 在 编译 无 法 进行 的 情况 
下 介入 执行 过 程 ， 可 以 通过 虚拟 机 的 -version 命令 的 输出 结果 显示 出 这 三 种 模式 ， 如 代码 
清单 15-1， 请 注意 加 粗 字 部 分 。 

代码 清单 15-1 虚拟 机 执行 模式 

C:\>java -version 
java version "1.6.0 22n 
Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 


Dynamic Code Evolution 64-Bit Server WM (build 0.2-b02-internal, 19.0-b04— 
internal, mixed mode) 
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C:\>java -Xint -version 

java version n1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server WM (build 0.2-b02-internal，19.0-b04- 
internal, intarpreted mode) 

C:\>java -Xcomp -version 

java version "1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server WM (build 0.2-b02-internal，19.0-b04- 
internal, compiled mode) 

由 于 即时 编译 器 编译 本 地 代码 需要 占用 程序 运行 时 间 ， 要 编译 出 优化 程度 更 高 的 代 
码 ， 所 花费 的 时 间 可 能 越 长 ， 而 且 想 要 编译 出 优化 程度 更 高 的 代码 ， 解 释 器 可 能 还 要 蔡 编 
译 器 收集 性 能 监控 信息 ， 这 对 解释 执行 的 速度 也 有 所 影响 。 为 了 在 程序 启动 响应 速度 与 运 
行 效率 之 间 达 到 最 佳 平衡 ，HotSpot 虚拟 机 将 会 逐渐 启用 分 层 编译 (Tiered Compilation) 的 策 
略 ， 分 层 编译 的 概念 在 JDK 1.6 时 期 出 现 ， 后 来 一 直 处 于 改进 阶段 ， 最 终 在 JDK 1.7 的 
Server 模式 虚拟 机 中 作为 默认 编译 策略 被 开启 。 分 层 编 译 根 据 编译 器 编译 、 优 化 的 规模 与 
耗 时 ， 划 分 出 不 同 的 编译 层次 ， 其 中 包括 : 

口 第 0 层 : 程序 解释 执行 ,解释 器 不 开启 性 能 监控 功能 (Profiling)， 可 触发 第 1 层 

编译 。 
口 第 1 层 : 也 称 为 Cl 编译 ， 将 字 节 码 编译 为 本 地 代码 ， 进 行 简单 可 靠 的 优化 ， 如 
有 必要 将 加 入 性 能 监控 的 逻辑 。 

口 “第 2 层 (或 2 层 以 上 ): 也 称 为 C2 编译 ， 也 是 将 字 节 码 编译 为 本 地 代码 ， 但 是 会 启 
用 一 些 编译 耗 时 较 长 的 优化 ， 甚 至 会 根据 性 能 监控 信息 进行 一 些 不 可 靠 的 激进 
优化 。 

实施 分 层 编译 后 ，Client Compiler 和 Server Compiler 将 会 同时 工作 ， 许 多 代码 都 可 能 
会 被 多 次 编译 ， 用 Client Compiler 获取 更 高 的 编译 速度 ， 用 Server Compiler 来 获取 更 好 的 
编译 质量 ， 在 解释 执行 的 时 候 也 无 需 再 承担 收集 性 能 监控 信息 的 任务 。 


15.2.3 ”编译 对 象 与 触发 条 件 


在 概述 中 提 到 过 在 运行 过 程 中 会 被 即时 编译 器 编译 的 “热点 代码 ”有 两 类 ， 即 : 

口 ”被 多 次 调用 的 方法 。 

口 ”被 多 次 执行 的 循环 体 。 

前 者 很 好 理解 ， 一 个 方法 被 调用 得 多 了 ， 方 法 体内 代码 执行 的 次 数 自 然 就 多 ， 它 成 为 
“热点 代码 ”是 理所当然 的 。 而 后 者 则 是 为 了 解决 当 一 个 方法 只 被 调用 过 一 次 或 几 次 ， 但 
是 方法 体内 部 存在 循环 次 数 较 多 的 循环 体 ， 这 样 循环 体 的 代码 也 被 重复 执行 多 次 ， 因 此 这 
些 代码 也 应 该 成 为 “热点 代码 ”。 

对 于 第 一 种 情况 ， 由 于 是 由 方法 调用 触发 的 编译 ， 那 编译 器 理所当然 地 会 以 整个 方法 
作为 编译 对 象 ， 这 种 编译 也 是 虚拟 机 中 标准 的 编译 方式 。 而 对 于 后 一 种 情况 ， 尽 管 编译 动 
作 是 由 循环 体 所 触发 的 ， 但 编译 器 依然 会 以 整个 方法 (而 不 是 单独 的 循环 体 ) 作 为 编译 对 
象 。 这 种 编译 方式 因为 编译 发 生 在 方法 执行 过 程 之 中 ， 因 此 被 很 形象 地 称 为 栈 上 蔡 换 (On 
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读者 可 能 还 会 有 疑问 ， 在 上 面 的 文字 描述 里 ， 无 论 是 “多 次 执行 的 方法 ”， 还 是 
“多 次 执行 的 代码 块 ”， 所 谓 “ 多 次 ”都 不 是 一 个 具体 、 严 说 的 用 语 ， 那 到 底 多少 次 才 算 
“多 次 ”了 呢 ? 还 有 一 个 问题 ， 就 是 虚拟 机 如 何 统计 一 个 方法 或 一 段 代码 被 执行 过 多 少 次 
呢 ? 解决 了 这 两 个 问题 ， 也 就 回答 了 即时 编译 被 触发 的 条 件 。 
要 知道 一 段 代 码 是 不 是 热点 代码 ， 是 不 是 需要 触发 即时 编译 ， 这 个 行为 称 为 热点 探测 
(Hot Spot Detection)， 其 实 进行 热 点 探测 并 不 一 定 要 知道 方法 具体 被 调用 了 多 少 次 ， 目 前 主 
要 的 热点 探测 判定 方式 有 两 种 ， 分 别 是 : 
口 ” 基 于 采样 的 热点 探测 (Sample Based Hot Spot Detection): 采用 这 种 方法 的 虚拟 机 会 
周期 性 地 检查 各 个 线程 的 栈 项 ， 如 果 发 现 某 个 (或 某 些 ) 方 法 经 常 出 现在 栈 项 ， 那 
这 个 方法 就 是 “热点 方法 ”。 基 于 采样 的 热点 探测 的 好 处 是 实现 简单 高 效 ， 还 可 
以 很 容易 地 获取 方法 调用 关系 (将 调用 堆栈 展开 即 可 )， 缺 点 是 很 难 精 确 地 确认 一 
个 方法 的 热度 ， 容 易 因为 受到 线程 阻塞 或 别 的 外 界 因素 的 影响 而 扰乱 热点 探测 。 

口 ”基于 计数 器 的 热点 探测 (Counter Based Hot Spot Detection): 采用 这 种 方法 的 虚拟 
机 会 为 每 个 方法 (甚至 是 代码 块 ) 建 立 计 数 器 ， 统 计 方法 的 执行 次 数 ， 如 果 执 行 次 
数 超过 限定 的 阔 值 就 认为 它 是 “热点 方法 ”。 这 种 统计 方法 实现 起 来 麻烦 一 些 ， 
需要 为 每 个 方法 建立 并 维护 计数 器 ， 而 且 不 能 直接 获取 到 方法 的 调用 关系 。 但 是 
它 的 统计 结果 相对 来 说 更 加 精确 、 严 谨 。 

在 HotSpot 虚拟 机 中 使 用 的 是 第 二 种 一 一 基于 计数 器 的 热点 探测 方法 ， 因 此 它 为 每 个 
方法 准备 了 两 个 计数 器 : 方法 调用 计数 器 (Invocation Counter) 和 回 边 计数 器 (Back Edge 
CounteD。 在 确定 虚拟 机 运行 参数 的 前 提 下 ， 这 两 个 计数 器 都 有 一 个 确定 的 阔 值 ， 当 计数 
器 超过 疮 值 溢出 了 ， 就 会 触发 IT 编译 。 

我 们 首先 来 看 看 方法 调用 计数 器 。 顾 名 思 义 ， 这 个 计数 器 用 于 统计 方法 被 调用 的 次 
数 ， 它 的 默认 阔 值 在 Client 模式 下 是 1500 次 ， 在 Server 模式 下 是 10000 次 ， 这 个 阔 值 可 
以 通过 虚拟 机 参数 -XX: CompileThreshold 来 人 工 设 定 。 当 一 个 方法 被 调用 时 ， 会 先 检查 
该 方法 是 否 存在 被 JIT 编译 过 的 版 本 ， 如 果 存 在 ， 则 优先 使 用 编译 后 的 本 地 代码 来 执行 。 
如 果 不 存在 已 被 编译 过 的 版 本 ， 则 将 此 方法 的 调用 计数 器 值 加 1， 然 后 判断 方法 调用 计数 
器 与 回 边 计 数 器 值 之 和 是 否 超过 方法 调用 计数 器 的 阔 值 。 如 果 已 超过 阔 值 的 话 ， 将 会 向 即 
时 编译 器 提交 一 个 该 方法 的 代码 编译 请 求 。 

在 默认 设置 下 ， 执 行 引擎 并 不 会 同步 等 待 编 译 请 求 完成 ， 而 是 继续 进入 解释 器 按照 解 
释 方式 执行 字 节 码 ， 直 到 提交 的 请 求 被 编译 器 编译 完成 。 当 编译 工作 完成 之 后 ， 这 个 方法 
的 调用 入 口 地 址 就 会 被 系统 自动 改写 成 新 的 地 址 ， 下 一 次 调用 该 方法 时 就 会 使 用 已 编译 的 
版 本 。 

在 默认 设置 下 ， 方 法 调用 计数 器 统计 的 并 不 是 方法 被 调用 的 绝对 次 数 ， 而 是 一 个 相对 
的 执行 频率 ， 即 一 段 时 间 之 内 方法 被 调用 的 次 数 。 当 超过 一 定 的 时 间 限 度 ， 如 果 方 法 的 调 
用 次 数 仍 然 不 足以 让 它 提交 给 即时 编译 器 编译 ， 那 这 个 方法 的 调用 计数 器 就 会 被 减少 一 
半 ， 这 个 过 程 称 为 方法 调用 计数 器 的 热度 衰减 (Counter Decay)， 而 这 段 时 间 就 称 为 此 方法 
统计 的 半 衰 周期 (Counter Half Life Time)， 进 行 热度 衰减 的 动作 是 在 虚拟 机 进行 垃圾 收集 时 
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顺便 进行 的 ， 可 以 使 用 虚拟 机 参数 -XX:-UseCounterDecay 来 关闭 热度 衰减 ， 让 方法 计数 器 
统计 方法 调用 的 绝对 次 数 ， 这 样 ， 只 要 系统 运行 时 间 足 够 长 ， 绝 大 部 分 方法 都 会 被 编译 成 
本 地 代码 。 另 外 可 以 使 用 -XX:CounterHalfLifeTime 参数 设置 半 衰 周期 的 时 间 ， 单 位 是 秒 。 

现在 我 们 再 来 看 看 另外 一 个 计数 器 一 一 回 边 计数 器 ， 它 用 于 统计 一 个 方法 中 循环 体 代 
码 执行 的 次 数 ， 在 字 节 码 中 遇 到 控制 流向 后 跳 转 的 指令 就 称 为 “ 回 边 (Back Edge)”， 显 然 
建立 回 边 计数 器 统计 的 目的 就 是 为 了 触发 OSR 编译 。 

关于 回 边 计数 器 的 阔 值 ， 虽 然 HotSpot 虚拟 机 也 提供 了 一 个 类 似 于 方法 调用 计数 器 阔 
值 -XX:CompileThreshold 的 参数 -XX:BackEdgeThreshold 供用 户 设置 ， 但 准确 地 说 ， 应 当 是 
回 边 的 次 数 而 不 是 循环 次 数 ， 因 为 并 非 所 有 的 循环 都 是 回 边 ， 如 空 循环 实际 上 就 可 以 视 为 
自己 跳 转 到 自己 的 过 程 ， 因 此 并 不 算 作 控制 流向 后 跳 转 ， 也 不 会 被 回 边 计数 器 统计 。 

是 当前 的 虚拟 机 实际 上 并 未 使 用 此 参数 ， 因 此 我 们 需要 设置 另外 一 个 参数 - 
XX:OnStackReplacePercentage 来 间接 调整 回 边 计数 器 的 阔 值 ， 其 计算 公式 为 : 

虚拟 机 运行 在 Client 模式 下 ， 回 边 计数 器 阔 值 计算 公式 为 : 方法 调用 计数 器 阔 值 
(CompileThreshold) 乘 以 OSR 比 率 (OnStackReplacePercentage) 除 以 100 。 其 中 
OnStackReplacePercentage 默认 值 为 933， 如 果 都 取 默 认 值 ， 那 Client 模式 虚拟 机 的 回 边 计 
数 器 的 阔 值 为 13995。 

虚拟 机 运行 在 Server 模式 下 ， 回 边 计数 器 阔 值 的 计算 公式 为 : 方法 调用 计数 器 闵 值 
(CompileThreshold) 乘 以 (OSR 比 率 (OnStackReplacePercentage) 减 去 解释 器 监控 比率 
(InterpreterProfilePercentage) 的 差 值 ) 除 以 100。 其 中 OnStackReplacePercentage 默认 值 为 
140，InterpreterProfilePercentage 默认 值 为 33， 如 果 都 取 默认 值 ， 那 么 Server 模式 虚拟 机 
回 边 计数 器 的 冰 值 为 10700。 

当 解 释 器 遇 到 一 条 回 边 指令 时 ， 会 先 查 找 将 要 执行 的 代码 片段 是 否 有 已 经 编译 好 的 版 
本 ， 如 果 有 的 话 ， 它 将 会 优先 执行 已 编译 的 代码 ， 和 否则 就 把 回 边 计数 器 的 值 加 1， 然 后 判 
断 方法 调用 计数 器 的 值 与 回 边 计数 器 的 值 两 者 之 和 是 否 超过 回 边 计数 器 的 阔 值 。 当 超过 阔 
值 的 时 候 ， 将 会 提交 一 个 OSR 编译 请 求 ， 并 且 把 回 边 计数 器 的 值 降 低 一 些 ， 以 便 继 续 在 
解释 器 中 执行 循环 ， 等 待 编译 器 输出 编译 结果 。 

与 方法 计数 器 不 同 ， 回 边 计 数 器 没有 计数 热度 衰减 的 过 程 ， 因 此 这 个 计数 器 统计 的 就 
是 该 方法 循环 执行 的 绝对 次 数 。 当 计数 器 溢出 的 时 候 ， 它 还 会 把 方法 计数 器 的 值 也 调整 到 
溢出 状态 ， 这 样 下 次 再 进入 该 方法 的 时 候 就 会 执行 标准 编译 过 程 。 对 于 Server VM 来 说 ， 
执行 情况 会 比 上 面 描述 的 还 要 复杂 。 


15.2.4 ”编译 过 程 


在 默认 设置 下 ， 无 论 是 方法 调用 产生 的 即时 编译 请 求 ， 还 是 OSR 编译 请 求 ， 虚 拟 机 
在 代码 编译 器 还 未 完成 之 前 ， 都 仍然 将 按照 解释 方式 继续 执行 ， 而 编译 动作 则 在 后 台 的 编 
译 线程 中 进行 。 用 户 可 以 通过 参数 -XX:-BackgroundCompilation 来 禁止 后 台 编译 ， 禁 止 后 
台 编 译 后 ， 当 达到 JIT 的 编译 条 件 ， 执 行 线程 向 虚拟 机 提交 编译 请 求 后 将 会 一 直 等 待 ， 直 
到 编译 过 程 完成 后 再 开始 执行 编译 器 输出 的 本 地 代码 。 

那 在 后 台 执行 编译 的 过 程 中 ， 编 译 器 做 了 什么 事情 呢 ? Server Compiler 和 Client 
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Compiler 两 个 编译 器 的 编译 过 程 是 不 一 样 的 。 对 于 Client Compiler 来 说 ， 它 是 一 个 简单 快 
速 的 三 段 式 编译 器 ， 主 要 的 关注 点 在 于 局 部 性 的 优化 ， 而 放弃 了 许多 耗 时 较 长 的 全 局 优化 
手段 。 

(1) 在 第 一 个 阶段 ， 一 个 平台 独立 的 前 端 将 字 节 码 构 造成 一 种 高 级 中 间 代码 表示 (High- 
Level Intermediate Representaion，HIR)。HIR 使 用 静态 单 分 配 (Static Single Assignment， 
SSA) 的 形式 来 代表 代码 值 ， 这 可 以 使 得 一 些 在 HIR 的 构造 过 程 之 中 和 之 后 进行 的 优化 动作 
更 容易 实现 。 在 此 之 前 编译 器 会 在 字 节 码 上 完成 一 部 分 基础 优化 ， 如 方法 内 联 、 常 量 传播 
等 优化 将 会 在 字 节 码 被 构造 成 HIR 之 前 完成 。 

(2) 在 第 二 个 阶段 ， 一 个 平台 相关 的 后 端 从 HIR 中 产生 低级 中 间 代 码 表 示 (Low-Level 
Intermediate Representation，LIR)， 而 在 此 之 前 会 在 HIR 上 完成 另外 一 些 优化 ， 如 空 值 检 
查 消除 、 范 围 检查 消除 等 ， 以 便 让 HIR 达到 更 高 效 的 代码 表示 形式 。 

(3) 最 后 的 阶段 是 在 平台 相关 的 后 端 使 用 线性 扫描 算法 (Linear Scan Register Allocation) 
在 LIR 上 分 配 寄存 器 ， 并 在 LIR 上 做 窥 孔 (Peephole) 优 化 ， 然 后 产生 机 器 代码 。 而 Server 
Compiler 则 是 专门 面向 服务 端的 典型 应 用 并 为 服务 端的 性 能 配置 特别 调整 过 的 编译 器 ， 也 
是 一 个 充分 优化 过 的 高 级 编译 器 ， 几 乎 能 达到 GNU C++ 编译 器 使 用 -02 参数 时 的 优化 强 
度 ， 它 会 执行 所 有 的 经 典 的 优化 动作 ， 如 : 无 用 代码 消除 (Dead Code Elimination)、 循 环 展 
开 (Loop Unrolling)、 循 环 表 达 式 外 提 (Loop Expression Hoisting)、 公 共 子 表达 式 消除 
(Common Subexpression Elimination)、 常 量 传播 (Constant Propagation)、 基 本 块 重 排序 (Basic 
Block Reordering) 等 ， 还 会 实施 一 些 与 Java 语言 特性 密切 相关 的 优化 技术 ， 如 范围 检查 消 
除 (Range Check Elimination)、 空 值 检 查 消除 (Null Check Elimination， 不 过 并 非 所 有 的 空 值 
检查 消除 都 是 依赖 编译 器 进行 优化 的 ， 有 一 些 是 在 代码 运行 过 程 中 自动 优化 了 ) 等 。 另 外 ， 
还 可 能 根据 解释 器 或 Client Compiler 提供 的 性 能 监控 信息 ， 进 行 一 些 不 稳定 的 激进 优化 ， 
如 守护 内 联 (Guarded Inlining)、 分 支 频率 预测 (Branch Frequency Prediction) 等 ， 本 章 的 下 半 
部 分 将 会 挑选 上 述 的 一 部 分 优化 手段 进行 分 析 讲解 。 

Server Compiler 的 寄存 器 分 配器 是 一 个 全 局 图 着 色 分 配器 ， 它 可 以 充分 利用 某 些 处 理 
器 架构 (如 RISC) 上 的 大 寄存 器 集合 。 以 即时 编译 的 标准 来 看 ，Server Compiler 无 疑 是 比较 
缓慢 的 ， 但 它 的 速度 仍然 远 远 超过 传统 的 静态 优化 编译 器 ， 而 且 它 相对 于 Client Compiler 
编译 输出 的 代码 质量 有 所 提高 ， 可 以 减少 本 地 代码 的 执行 时 间 ， 从 而 抵消 了 额外 的 编译 时 
间 开 销 ， 所 以 也 有 很 多 非 服务 端的 应 用 选择 使 用 Server 模式 的 虚拟 机 运行 。 


15.2.5 ”查看 与 分 析 即 时 编译 结果 


一 般 来 说 ， 虚 拟 机 的 即时 编译 过 程 对 用 户 程序 是 完全 透明 的 ， 虚 拟 机 通过 解释 执行 代 
码 还 是 编译 执行 代码 ， 对 于 用 户 来 说 并 没有 什么 影响 (执行 结果 没有 影响 ， 速 度 上 会 有 很 大 
差别 )， 大 多 数 情况 下 用 户 也 没有 必要 知道 。 但 是 虚拟 机 也 提供 了 一 些 参数 用 来 输出 即时 编 
译 和 某 些 优化 手段 (如 方法 内 联 ) 的 执行 状况 ， 本 节 将 介绍 如 何 从 外 部 观察 虚拟 机 的 即时 编 
译 行为 。 

本 节 中 提 到 的 运行 参数 有 一 部 分 需要 Debug 或 FastDebug 版 虚拟 机 的 支持 ，Product 版 
的 虚拟 机 无 法 使 用 这 部 分 参数 。 如 果 读 者 使 用 的 是 根据 本 书 第 1 章 的 教程 自己 编译 的 
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JDK， 请 注意 将 SKIP DEBUG BUILD 或 SKIP FASTDEBUG BUILD 参数 设置 为 false， 
也 可 以 在 OpenjDK 网 站 上 直接 下 载 FastDebug 版 的 JDK。 本 节 中 所 有 的 测试 都 基于 代码 清 
单 15-2 所 示 的 Java 代码 。 

代码 清单 15-2 

public static final int NUM = 15000; 
public static int doubleValue (int i) { 
return i *, 2; 
} 
public static long calcSum() { 
long sum = 0; 

首先 运行 这 段 代码 ， 并 且 确 认 这 段 代 码 是 否 触 发 了 即时 编译 ， 要 知道 某 个 方法 是 否 被 
编译 过 ， 可 以 使 用 参数 -XX:+PrintCompilation 要 求 虚拟 机 在 即时 编译 时 将 被 编译 成 本 地 代 
码 的 方法 名 称 打印 出 来 ， 如 代码 清单 15-3 所 示 ( 其 中 带 有 “%” 的 输出 说 明 是 由 回 边 计数 
器 触发 的 OSR 编译 )。 

代码 清单 15-3 ”被 即时 编译 的 代码 

VM option '+PrintCompilation' 

3L0 AT java .lang. String::charAt(33 bytes) 

329 20rg. fenixsoft. jit .Test::calcSum (26 bytes) 
329 30rg. fenixsoft. jJit .Test:: doubleValue(4 bytes) 
332 1%org.fenixsoft.jit.Test::main@5(20 bytes) 

从 代码 清单 15-3 输出 的 确认 信息 中 可 以 确认 main(). calcSum() 和 doubleValue() 方 法 已 
经 被 编译 ， 我 们 还 可 以 加 上 参数 -XX:+Printlnlining 要 求 虚拟 机 输出 方法 内 联 信息 ， 如 代码 
清单 15-4。 

代码 清单 15-4 ”内 联 信息 

VM option '+PrintCompilation' 

{ 

VM option '+PrintInliningi 

273 1java.lang.string::charAt (33 bytes) 

291 20rg.fenixsoft.jit.Test::calcSum (26 bytes) 

@90rg. fenixsoft-j] it .Test:: doubleValue inline( hot) { 
294 30rg. fenixsoft.jit. Test::doubleValue (4 bytes) 1 

295 1%org.fenixsoft.jit.Test::main@5 (20 bytes) 

@50rg. fenixsoft.jit .Test::calcSum inline (hot) 有 

@9 Org. fenixsoft.jit .Test:: doubleValue inline( hot) 本 
kl 

从 代码 清单 15-4 的 输出 中 可 以 看 到 方法 doubleValue() 被 内 联 编译 到 calcSum0 中 ， 而 
calcSum() 又 被 内 联 编译 到 方法 main(0) 里 面 ， 所 以 虚拟 机 再 次 执行 main() 方 法 的 时 候 ( 尽 管 
main() 方 法 并 不 会 运行 两 次 )，calcSum0 和 doubleValue() 方 法 都 不 会 再 被 调用 ， 它 们 的 代码 
逻辑 都 被 直接 内 联 到 main() 方 法 里 面 了 。 

除了 查看 哪些 方法 被 编译 之 外 ， 还 可 以 进一步 查看 即时 编译 器 生成 的 机 器 码 内 容 ， 不 
过 如 果 虚 拟 机 输出 一 串 0 和 1， 对 于 我 们 的 阅读 来 说 是 没有 意义 的 ， 机 器 码 必 须 反 汇 编 成 
基本 的 汇编 语言 才 可 能 被 阅读 。 虚 拟 机 提供 了 一 组 通用 的 反 汇 编 接口 ， 可 以 接 入 各 种 平台 
下 的 反 汇 编 适配器 来 使 用 ， 如 使 用 32 位 x86 平台 则 选用 hsdis-i386 适配器 ， 其 余 平台 的 适 
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配器 还 有 如 hsdis-amd64、hsdis-sparc 和 hsdis-sparcv9 等 ， 可 以 下 载 或 自己 编译 出 反 汇编 适 
配器 后 ， 将 其 放置 在 JRE/bin/client 或 /servier 目录 下 ， 只 要 与 jvm.dll 的 路 径 相同 即 可 被 虚 
拟 机 调用 。 为 虚拟 机 安装 了 反 汇编 适 配器 之 后 ， 就 可 以 使 用 -XX:+PrintAssembly 参数 要 求 
虚拟 机 打印 编译 方法 的 汇编 代码 了 如 果 没 有 hsdis 支持 ， 也 可 以 使 用 -XX: 
printOptoAssembly( 用 于 Server VM) 或 -XX:+print LIR( 用 于 Client VM) 来 输出 比较 接近 最 终 
结果 的 中 间 代 码 表 示 。 

如 果 除 了 本 地 代码 的 生成 结果 外 ， 还 想 再 进一步 跟踪 本 地 代码 生成 的 具体 过 程 ， 那 还 
可 以 使 用 参数 -XX:+PrintCFGToFile( 使 用 Client Compiler) 或 -XX:PrintIdealGraphFile( 使 用 
Server Compiler) 令 虚拟 机 将 编译 过 程 中 各 个 阶段 的 数据 (如 对 Cl 编译 器 来 说 包括 : 字 节 
码 、HIR 生成 、LIR 生成 、 寄 存 器 分 配 过 程 、 本 地 代码 生成 等 数据 ) 输 出 到 文件 中 。 然 后 使 
用 Java HotSpot Client Compiler Visualizer( 使 用 Client Compiler) 或 Ideal Graph Visualizer( 使 
用 Server Compiler) 打 开 这 些 数 据 文件 进行 分 析 。 

实际 使 用 的 时 候 请 注意 ， 要 输出 CFG 或 IdealGraph 文件 ， 需 要 一 个 Debug 版 的 虚拟 
机 支持 ，Product 版 或 FastDebug 版 的 虚拟 机 无 法 输出 这 些 文件 。 前 面 提 到 的 使 用 -XX: 
+PrintAssembly 参数 输出 反 汇编 信息 也 需要 FastDebug 版 的 虚拟 机 才能 直接 支持 ， 如 果 使 
用 Product 版 的 虚拟 机 ， 则 需要 加 入 参数 -XX:+UnlockDiagnosticVMOptions 打开 虚拟 机 诊 
断 模式 后 才能 使 用 。 


15.3 ”编译 优化 技术 


Java 程序 员 都 有 一 个 共同 的 认 知 ， 以 编译 方式 执行 本 地 代码 比 解释 方式 更 快 ， 其 中 除 
去 虚拟 机 解释 执行 字 节 码 时 额外 消耗 的 时 间 以 外 ， 还 有 一 个 很 重要 的 原因 就 是 JDK 设计 团 
队 几 乎 把 对 代码 的 所 有 优化 措施 都 集中 在 了 即时 编译 器 之 中 ， 所 以 一 般 来 说 即时 编译 器 产 
生 的 本 地 代码 会 比 Javac 产生 的 字 节 码 更 优秀 ， 接 下 来 我 们 就 介绍 一 些 HotSpot 虚拟 机 的 
即时 编译 器 在 生成 代码 时 采用 的 代码 优化 技术 。 


15.3.1 优化 技术 概览 


Sun 官方 的 Wiki 上 ，HotSpot 虚拟 机 设计 团队 列 出 了 一 个 相对 比较 全 面 的 、 即 时 编译 
器 中 采用 的 优化 技术 列表 ， 如 表 15-1 所 示 。 其 中 有 不 少 经 典 编译 器 的 优化 手段 ， 也 有 许多 
针对 Java 语言 (准确 地 说 是 针对 运行 在 Java 虚拟 机 上 的 所 有 语言 ) 本 身 进 行 的 优化 技术 ， 本 
节 将 对 这 些 技术 进行 一 遍 简单 的 概览 ， 在 后 面 的 几 节 中 ， 笔 者 将 挑选 若干 最 重要 或 最 典型 
的 优化 ， 与 读者 一 起 看 看 优化 前 后 的 代码 发 生 了 怎样 的 变化 。 


PO TO 六 


Ee 所 机 开发 


表 15-1 即时 编译 器 优化 技术 


类 型 优化 技术 
延迟 编译 (delayed compilation) 
分 层 编译 (tiered compilation) 
栈 上 替换 (on-stack replacement) 
延迟 优化 (delayed reoptimization) 
编译 器 策略 程序 依赖 图 表示 (program dependence graph representation) 
(compiler tactics) 静态 单 赋值 表示 (static single assignment representation) 
乐观 空 值 断言 (optimistic nullness assertions) 
乐观 类 型 断言 (optimistic type assertions) 
乐观 类 型 增强 (optimistic type strengthening) 
乐观 数组 长 度 增强 (optimistic array length strengthening) 
裁剪 未 被 选择 的 分 支 (untaken branch pruning) 
乐观 的 多 态 内 联 (optimistic N-morphic inlining) 
分 支 频 率 预测 (branch frequency prediction) 
基于 性 能 监控 的 优化 技术 调用 频率 预测 (call frequency prediction) 
(profile-based techniques) 精确 类 型 推断 (exact type inference) 
内 存 值 推断 (memory value inference) 
内 存 值 跟踪 (memory value tracking) 
常量 折 友 (constant folding) 
重组 (reassociatiQn) 
操作 符 退 化 (operator strength reduction) 
空 值 检查 消除 (null check elimination) 
基于 证 据 的 优化 技术 类 型 检测 退化 (type test strength reduction) 
(proof-based techniques) 类 型 检测 消除 (type test elimination) 
代数 化 简 (algebraic simplification) 
公共 子 表达 式 消除 (common subexpression elimination 
条 件 常量 传播 (conditional constant propagation) 
基于 流 承 载 的 类 型 缩减 转换 (flow-carried type narrowing) 


数据 流 敏感 重 写 无 用 代码 消除 (dead code elimination) 
(flow-sensitive rewrites) 类 型 继承 关系 分 析 (class hierarchy analysis) 
去 虚拟 机 化 (devirtualization) 


符号 常量 传播 (symbolic constant propagation) 
自动 装 箱 消除 (autobox elimination) 


逃逸 分 析 (escape analysis) 
语言 相关 的 优化 技术 锁 消除 dock elision) 
(language-specific techniques) 锁 膨 胀 (lock coarsening) 

消除 反射 (de-reflection) 


表达 式 提升 (expression hoisting) 


加 < a 


第 15 章 运行 期 优化 


类 型 


内 存 及 代码 位 置 变 换 
(memory and placement 


transformation) 


续 表 
优化 技术 
表达 式 下 沉 (expression sinking) 
元 余 存 储 消除 (redundant store elimination) 


相 邻 存储 合并 (adjacent store fusion) 


交汇 点 分 离 (merge-point splitting) 
循环 展开 (loop unrolling) 


循环 变换 (loop transformations) 


循环 剥离 (loop peeling) 

安全 点 消除 (safepoint elimination) 

迁 代 范围 分 离 (iteration range splitting) 
范围 检查 消除 (range check elimination) 
循环 向 量化 (loop vectorization) 


全 局 代码 调整 
(global code shaping) 


控制 流 图 变换 
(control flow graph transformation) 


内 联 (inlining) 

全 局 代码 外 提 (global code motion) 

基于 热度 的 代码 布局 (heat-based code layout) 

Switch 调整 (switch balancing) 

本 地 代码 编排 (local code scheduling) 

本 地 代码 封包 (local code bundling) 
延迟 槽 填充 (delay slot filling) 

着 色 图 寄存 器 分 配 (graph-coloring register allocation) 
线性 扫描 寄存 器 分 配 (linear scan register allocation) 
复写 聚合 (copy coalescing) 

常量 分 裂 (constant splitting) 

复写 移 除 (copy removal) 

地 址 模式 匹配 (address mode matching) 

指令 窥 孔 优化 (instruction peepholing) 

基于 确定 有 限 状 态 机 的 代码 生成 (DFA-based code generator) 


上 述 的 优化 技术 看 起 来 很 多 ， 而 且 名 字 看 起 来 都 显得 有 点 “高 深 莫 测 ”， 实 际 上 实现 
这 些 优化 也 许 确实 有 些 难 度 ， 但 大 部 分 技术 理解 起 来 都 并 不 困难 ， 笔 者 举 一 个 最 简单 的 
例子 来 展示 其 中 几 种 优化 技术 是 如 何 发 挥 作 用 的 。 首 先 从 原始 代码 开始 ， 如 代码 清单 15-5 


所 示 。 


代码 清单 15-5 ”优化 前 的 原始 代码 


static class B{ 

int value. 

final int get(){ 
return value; 

) 

) 

public void foo() { 
y=b. get()j 

Ve (OR 
z=b. get()j 


fi jdmbik 


WS 和 =<< 权衡 优化 、 高 效 和 安全 的 最 优 方 案 


SUlIl=y+2j 
) 
首先 需要 明确 一 点 的 是 ， 这 些 代 码 的 优化 变换 都 是 建立 在 代码 的 某 种 中 间 表 示 上 ， 绝 
不 是 建立 在 Java 源码 之 上 的 ， 笔 者 为 了 展示 方便 ， 使 用 了 Java 语言 的 语法 来 表示 这 些 优 
化 技术 所 发 挥 的 作用 。 代 码 清单 15-5 的 代码 已 经 非常 简单 了 ， 但 是 仍 有 许多 优化 的 余地 。 
首先 进行 方法 内 联 ( Method Inlining)， 内 联 的 主要 目的 有 两 个 ， 一 是 去 除 方法 调用 的 成 本 
(如 建立 栈 帧 等 )， 二 是 为 其 他 优化 建立 良好 的 基础 。 方 法 内 联 膨胀 之 后 可 以 便于 在 更 大 范 
围 上 进行 后 续 的 优化 手段 ， 可 以 获取 更 好 的 优化 效果 ， 因 此 各 种 编译 器 一 般 都 会 把 内 联 优 
化 放 在 优化 序列 的 靠 前 位 置 。 内 联 后 的 代码 如 代码 清单 15-6 所 示 。 
代码 清单 15-6 


public void foo(){ 

y = b.value; 

z= b.value; 

Sum = Y+Z7 

} 

再 看 消除 元 余 后 的 代码 (代码 清单 15-7): 
代码 清单 15-7 


public void foo(){ 

Y = b.value; 

sum = Y+yY7 

} 

经 过 优化 之 后 ， 代 码 清单 15-7 与 代码 清单 15-6 所 达到 的 效果 是 一 致 的 ， 但 是 前 者 比 
后 者 省 略 了 许多 语句 (体现 在 字 节 码 和 机 器 码 指令 上 的 差距 会 更 大 )， 执 行 效率 也 更 高 。 编 
译 器 的 这 些 优化 技术 实现 起 来 也 许 比较 复杂 ， 但 是 要 理解 它们 的 行为 对 于 一 个 普通 的 程序 
员 来 说 是 没有 困难 的 ， 接 下 来 我 们 继续 查看 如 下 的 几 项 优化 技术 是 如 何 运 作 的 ， 它 们 分 
别 是 : 
语言 无 关 的 经 典 优化 技术 之 一 : 公共 子 表达 式 消除 。 
语言 相关 的 经 典 优化 技术 之 一 : 数组 范围 检查 消除 。 
最 重要 的 优化 技术 之 一 : 方法 内 联 。 
最 前 沿 的 优化 技术 之 一 : 逃逸 分 析 。 


15.3.2 ”公共 子 表达 式 消除 


公共 子 表达 式 消 除 是 一 个 普遍 应 用 于 各 种 编译 器 的 经 典 优化 技术 ， 它 的 含义 是 : 如果 
一 个 表达 式 E 已 经 被 计算 过 了 ， 并 且 从 先前 的 计算 到 现在 E 中 所 有 变量 的 值 都 没有 发 生变 
化 ， 那 么 E 的 这 次 出 现 就 成 为 了 公共 子 表达 式 。 对 于 这 种 表达 式 ， 没 有 必要 花 时 间 再 对 它 
进行 计算 ， 只 需要 直接 用 前 面 计 算 过 的 表达 式 结果 代替 E 就 可 以 了 。 如 果 这 种 优化 仅 限于 
程序 的 基本 块 内 ， 便 称 为 局 部 公共 子 表 达 式 消除 (Local Common Subexpression 
Elimination)， 如 果 这 种 优化 的 范围 涵盖 了 多 个 基本 块 ， 那 就 称 为 全 局 公共 子 表达 式 消 除 
(Global Common Subexpression Elimination)。 举 个 简单 的 例子 来 说 明 它 的 优化 过 程 ， 假 设 存 


人 


[= 
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在 如 下 代码 : 


int d= (c*b) *12+a+ (at+b*c); 


如 果 这 段 代码 交 给 Javac 编译 器 则 不 会 进行 任何 优化 。 当 这 段 代 码 进入 到 虚拟 机 即时 
编译 器 后 ， 它 将 进行 如 下 优化 : 编译 器 检测 到 “c*b” 与 “bxc” 是 一 样 的 表达 式 ， 而 且 在 
计算 期 间 b 与 c 的 值 是 不 变 的 。 因 此 这 条 表达 式 就 可 能 被 视 为 : 


int d=E*l2+a+ (a+E); 


这 时 候 ， 编 译 器 还 可 能 (取决 于 哪 种 虚拟 机 的 编译 器 及 具体 的 上 下 文 ) 进 行 男 外 一 种 优 
化 一 一 代数 化 简 (Algebraic Simplification)， 把 表达 式 变 为 : 


int d=E*13+a*2; 


表达 式 进行 变换 之 后 ， 再 计算 起 来 就 可 以 节省 一 些 时 间 了 。 如 果 您 还 对 其 他 的 经 典 编 
译 优 化 技术 感 兴趣 ， 可 以 参考 《编译 原理 》( 俗 称 龙 书 ， 推 荐 使 用 Java 的 程序 员 看 2006 年 
版 的 紫 龙 书 ) 中 的 相关 章节 。 


15.3.3 ”数组 边界 检查 消除 


数组 边界 检查 消除 (Array Bounds Checking Elimination) 是 即时 编译 器 中 的 一 项 语言 相关 
的 经 典 优化 技术 。 我 们 知道 Java 语言 是 一 门 动态 安全 的 语言 ， 对 数组 的 读 写 访问 也 不 像 
C、C++ 那 样本 质 上 是 裸 指针 操作 。 如 果 有 一 个 数组 foo[]， 在 Java 语言 中 访问 数组 元 素 
foo[j] 的 时 候 系统 将 会 自动 进行 上 下 界 的 范围 检查 ， 即 检查 i 必须 满足 i>=0&&i< foo.length 
的 这 个 条 件 ， 和 否则 将 抛 出 一 个 运行 时 异常 : java.lang.ArrayIndexOutOfBoundsException。 这 
对 软件 开发 者 来 说 是 一 件 很 好 的 事情 ， 即 使 程序 员 没 有 专门 编写 防御 代码 ， 也 可 以 避免 大 
部 分 的 溢出 攻击 。 但 是 对 于 虚拟 机 的 执行 子 系统 来 说 ， 每 次 数组 元 素 的 读 写 都 带 有 一 次 隐 
含 的 条 件 判 定 操作 ， 对 于 拥有 大 量 数组 访问 的 程序 代码 ， 这 无 疑 也 是 一 种 性 能 负担 。 

无 论 如 何 ， 为 了 安全 ， 数 组 边界 检查 肯定 是 必须 做 的 ， 但 数组 边界 检查 是 不 是 必须 在 
运行 期 间 一 次 不 漏 地 检查 则 是 可 以 “商量 ”的 事情 。 例 如 这 个 简单 的 情况 : 数组 下 标 是 一 
个 常量 ， 如 foo[3]， 只 要 在 编译 期 根据 数据 流 分 析 来 确定 foo.length 的 值 ， 并 判断 下 标 
“3” 没 有 越界 ， 执 行 的 时 候 就 无 需 判断 了 。 更 加 常见 的 情况 是 数组 访问 发 生 在 循环 之 
中 ， 并 且 使 用 循环 变量 来 进行 的 数组 访问 ， 如 果 编 译 器 只 要 通过 数据 流 分 析 就 可 以 判定 循 
环 变量 的 取 值 范围 永远 在 区 间 [0，foo.length) 之 内 ， 那 在 整个 循环 中 就 可 以 把 数组 的 上 下 界 
检查 消除 掉 ， 这 可 以 节省 很 多 次 的 条 件 判断 操作 。 

与 语言 相关 的 其 他 消除 操作 还 有 不 少 ， 如 自动 装 箱 消除 (Autobox Elimination)、 安 全 点 
消除 (Safepoint Elimination)、 消 除 反 射 (Dereflection) 等 ， 笔 者 就 不 再 一 一 介绍 了 。 


15.3.4 方法 内 联 


在 前 面 的 讲解 中 我 们 提 到 过 方法 内 联 ， 它 是 编译 器 最 重要 的 优化 手段 之 一 ， 除 了 消除 
方法 调用 的 成 本 之 外 ， 它 更 重要 的 意义 是 为 其 他 优化 手段 建立 良好 的 基础 ， 如 代码 清单 
15-8 所 示 的 简单 例子 就 揭示 了 内 联 对 其 他 优化 手段 的 意义 : 事实 上 testInline0 方 法 的 内 部 


SN p> 


fi dab 
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全 部 都 是 无 用 的 代码 ， 如 果 不 做 内 联 ， 后 续 即 使 进行 了 无 用 代码 消除 的 优化 ， 也 无 法 发 现 
任何 “Dead Code”， 因 为 如 果 分 开 来 看 ，foo0 和 testlinlineO 两 个 方法 里 的 操作 都 可 能 有 
意义 。 

代码 清单 15-8 ”没有 做 优化 的 字 节 码 


public static void foo (Object obj){ 
if ( obj != null { 
System.out.println(“do thing”); 


1 
} 


public static void testInline(String [] args){ 
Object obj = null; 
Foo (obj); 


} 


方法 内 联 的 优化 行为 看 起 来 很 简单 ， 不 过 是 把 目标 方法 的 代码 “复制 ”到 发 起 调用 的 
方法 之 中 ， 避 免 发 生 真实 的 方法 调用 而 已 。 但 实际 上 Java 虚拟 机 中 的 内 联 过 程 远 远 没 有 那 
么 简单 ， 因 为 如 果 不 是 即时 编译 器 做 了 一 些 特别 的 努力 ， 按 照 经 典 编译 原理 的 优化 理论 ， 
大 多 数 的 Java 方法 都 无 法 进行 内 联 ! 无 法 内 联 的 原因 是 ， 这 是 因为 只 有 使 用 invokespecial 
指令 调用 的 私有 方法 、 实 例 构 造 器 、 父 类 方法 和 使 用 invokestatic 指令 进行 调用 的 静态 方法 
才 是 在 编译 期 进行 解析 的 ， 除 了 上 述 4 种 方法 之 外 ， 其 他 的 Java 方法 调用 都 需要 在 运行 时 
进行 方法 接收 者 的 多 态 选 择 ， 并 且 都 有 可 能 存在 多 于 一 个 版 本 的 方法 接收 者 (最 多 再 除去 被 
final 修饰 的 方法 这 种 特殊 情况 ， 尽 管 它 使 用 invokevirtual 指令 调用 ， 但 也 是 非 虚 方法 ， 
Java 语言 规范 中 明确 说 明了 这 一 点 )， 简 而 言 之 ，Java 语言 中 默认 的 实例 方法 就 是 虚 方法 。 

对 于 一 个 虚 方 法 ， 编 译 器 做 内 联 的 时 候 根本 就 无 法 确定 应 该 使 用 哪个 方法 版 本 ， 例 
如 ， 前 面 代码 清单 15-7 中 把 “b.get0” 内 联 为 “b.value”， 就 是 不 依赖 上 下 文 就 无 法 确定 
b 的 实际 类 型 是 什么 。 假 如 有 ParentB 和 SubB 两 个 具有 继承 关系 的 类 ， 并 且 子 类 重 写 了 父 
类 的 get0 方 法 ， 那 么 ， 是 要 执行 父 类 的 get() 方 法 还 是 子 类 的 get0 方 法 ， 需 要 在 运行 期 才能 
确定 ， 编 译 期 无 法 得 出 结论 。 

由 于 Java 语言 提倡 使 用 面向 对 象 的 编程 方式 进行 编程 ， 而 Java 对 象 的 方法 默认 就 是 
虚 方法 ， 因 此 Java 间接 鼓励 了 程序 员 使 用 大 量 的 虚 方 法 来 完成 程序 逻辑 。 根 据 我 们 上 面 的 
分 析 ， 内 联 与 虚 方法 之 间 会 产生 “了 矛盾 ”， 那 该 怎么 办 呢 ? 是 不 是 为 了 提高 执行 性 能 ， 就 
要 到 处 使 用 final 关键 字 去 修饰 方法 呢 ? 

为 了 解决 虚 方法 的 内 联 问题 ，Java 虚拟 机 设计 团队 想 了 很 多 办 法 ， 首 先是 引入 了 一 种 
名 为 “类 型 继承 关系 分 析 ”(Class Hierarchy Analysis，CHA) 的 技术 ， 这 是 一 种 基于 整个 应 
用 程序 的 类 型 分 析 技 术 ， 它 用 于 确定 在 目前 已 加 载 的 类 中 ， 某 个 接口 是 否 有 多 于 一 种 的 实 
现 ， 某 个 类 是 否 存在 子 类 且 子 类 是 否 为 抽象 类 等 信息 。 

编译 器 在 进行 内 联 时 ， 如 果 是 非 虚 方法 ， 那 么 直接 进行 内 联 就 可 以 了 ， 这 时 候 的 内 联 
是 有 稳定 前 提 保 障 的 。 如 果 遇 到 虚 方法 ， 则 会 向 CHA 查询 此 方法 在 当前 程序 下 是 否 有 多 
个 目标 版 本 可 供 选 择 ， 如 果 查 询 结果 只 有 一 个 版 本 ， 那 也 可 以 进行 内 联 ， 不 过 这 种 内 联 就 
属于 激进 优化 ， 需 要 预 留 一 个 “逃生 门 ”(Guard 条 件 不 成 立时 的 Slow Path)， 称 为 守护 内 
联 (Guarded Inlining)。 如 果 程 序 的 后 续 执 行 过程 中 ， 虚 拟 机 一 直 没 有 加 载 到 会 令 这 个 方法 
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的 接收 者 的 继承 关系 发 生变 化 的 类 ， 那 这 个 内 联 优 化 的 代码 就 可 以 一 直 使 用 下 去 。 但 是 如 
果 加 载 了 导致 继承 关系 发 生变 化 的 新 类 ， 那 就 需要 抛弃 掉 已 经 编译 的 代码 ， 退 回 到 解释 状 
态 执行 ， 或 者 重新 进行 编译 。 

如 果 向 CHA 查询 出 来 的 结果 是 有 多 个 版 本 的 目标 方法 可 供 选 择 ， 则 编译 器 还 将 会 进 
行 最 后 一 次 努力 ， 使 用 内 联 缓存 (Inline Cache) 来 完成 方法 内 联 ， 这 是 一 个 建立 在 目标 方法 
正常 入 口 之 前 的 缓存 ， 它 的 工作 原理 大 致 是 : 在 未 发 生 方 法 调用 之 前 ， 内 联 缓存 状态 为 
空 ， 当 第 一 次 调用 发 生 后 ， 缓 存 记录 下 方法 接收 者 的 版 本 信息 ， 并 且 ， 每 次 进行 方法 调用 
时 都 比较 接收 者 版 本 ， 如 果 以 后 进来 的 每 次 调用 的 方法 接收 者 版 本 都 是 一 样 的 ， 那 这 个 内 
联 还 可 以 一 直 用 下 去 。 如 果 发 生 了 方法 接收 者 不 一 致 的 情况 ， 就 说 明 程 序 真正 使 用 到 了 虚 
方法 的 多 态 特 性 ， 这 时 候 才 会 取消 内 联 ， 查 找 虚 方法 表 进行 方法 分 派 。 

所 以 说 ， 在 许多 情况 下 虚拟 机 进行 的 内 联 都 是 一 种 激进 优化 ， 激 进 优化 的 手段 在 高 性 
能 的 商用 虚拟 机 中 很 常见 ， 除 了 内 联 之 外 ， 对 于 出 现 概率 很 小 (通过 经 验 数 据 或 解释 器 收集 
到 的 性 能 监控 信息 确定 概率 大 小 ) 的 隐 式 异常 、 使 用 概率 很 小 的 分 支 等 都 可 以 被 激进 优化 
“ 移 除 ” 掉 ， 如 果真 的 出 现 了 小 概率 事件 ， 这 时 才 会 从 “逃生 门 ” 回 到 解释 状态 重新 
执行 。 


15.3.5 ”逃逸 分 析 


逃逸 分 析 (Escape Analysis) 是 目前 Java 虚拟 机 中 比较 前 沿 的 优化 技术 ， 它 与 类 型 继承 
关系 分 析 一 样 ， 并 不 是 直接 优化 代码 的 手段 ， 而 是 为 其 他 优化 手段 提供 依据 的 分 析 技 术 。 
逃逸 分 析 的 基本 行为 就 是 分 析 对 象 动态 作用 域 : 当 一 个 对 象 在 方法 里 面 被 定义 后 ， 它 
可 能 被 外 部 方法 所 引用 ， 例 如 作为 调用 参数 传递 到 其 他 方法 中 ， 这 种 行为 称 为 方法 逃逸 。 
甚至 还 有 可 能 被 外 部 线程 访问 到 ， 璧 如 赋值 给 类 变量 或 可 以 在 其 他 线程 中 访问 的 实例 变 
量 ， 这 种 行为 称 为 线程 逃逸 。 
如 果 能 证 明 一 个 对 象 不 会 逃逸 到 方法 或 线程 之 外 ， 也 就 是 别 的 方法 或 线程 无 法 通过 任 
何 途 径 访问 到 这 个 对 象 ， 则 可 能 为 这 个 变量 进行 一 些 高 效 的 优化 ， 如 : 
栈 上 分 配 (Stack Allocations): Java 虚拟 机 中 ， 在 Java 堆 上 分 配 创建 对 象 的 内 存 空间 几 
乎 是 Java 程序 员 都 清楚 的 常识 了 ，Java 堆 中 的 对 象 对 于 各 个 线程 都 是 共享 和 可 见 的 ， 只 要 
持 有 这 个 对 象 的 引用 ， 就 可 以 访问 堆 中 存储 的 对 象 数据 。 虚 拟 机 的 垃圾 收集 系统 可 以 回收 
掉 堆 中 不 再 使 用 的 对 象 ， 但 回收 动作 无 论 是 筛选 可 回收 对 象 ， 还 是 回收 和 整理 内 存 都 需要 
耗费 时 间 。 如 果 确 定 一 个 对 象 不 会 逃逸 出 方法 之 外 ， 那 让 这 个 对 象 在 栈 上 分 配 内 存 将 会 是 
一 个 很 不 错 的 主意 ， 对 象 所 占用 的 内 存 空 间 就 可 以 随 栈 帧 出 栈 而 销毁 。 在 一 般 应 用 中 ， 不 
会 逃逸 的 局 部 对 象 所 占 的 比率 很 大 ， 如 果 能 使 用 栈 上 分 配 ， 那 大 量 的 对 象 就 会 随 着 方法 的 
结束 而 自动 销毁 了 ， 垃 圾 收集 系统 的 压力 将 会 小 很 多 。 
口 “” 同 步 消除 (Synchronization Elimination): 线程 同步 本 身 就 是 一 个 相对 耗 时 的 过 程 ， 
如 果 逃 逸 分 析 能 够 确定 一 个 变量 不 会 逃逸 出 线程 ， 无 法 被 其 他 线程 访问 ， 那 这 个 
变量 的 读 写 肯定 就 不 会 有 竞争 ， 对 这 个 变量 实施 的 同步 措施 也 就 可 以 消除 掉 。 
口 ”标量 替换 (Scalar Replacement): 标量 (Scalar) 是 指 一 个 数据 已 经 无 法 再 分 解 成 更 小 
的 数据 来 表示 了 ，Java 虚拟 机 中 的 原始 数据 类 型 (int、long 等 数值 类 型 及 


NOV NS >> 


evant 


“2 权衡 优化 、 高 效 和 安全 的 最 优 方案 


reference 类 型 等 ) 都 不 能 再 进一步 分 解 ， 它 们 就 可 以 被 称 为 标量 。 相 对 的 ， 如 果 一 
个 数据 可 以 继续 分 解 ， 那 它 就 被 称 做 聚合 量 (Aggregate)，Java 中 的 对 象 就 是 最 典 
型 的 聚合 量 。 如 果 把 一 个 Java 对 象 拆散 ， 根 据 程序 访问 的 情况 ， 将 其 使 用 到 的 成 
员 变 量 恢复 原始 类 型 来 访问 就 叫做 标量 替换 。 如 果 逃 逸 分析 证 明 一 个 对 象 不 会 被 
外 部 访问 ， 并 且 这 个 对 象 可 以 被 拆散 的 话 ， 那 程序 真正 执行 的 时 候 将 可 能 不 创建 
这 个 对 象 ， 而 改 为 直接 创建 它 的 若干 个 被 这 个 方法 使 用 到 的 成 员 变 量 来 代替 。 将 
对 象 拆 分 后 ， 除 了 可 以 让 对 象 的 成 员 变量 在 栈 上 ( 栈 上 存储 的 数据 ， 很 大 机 会 会 被 
虚拟 机 分 配 至 物理 机 器 的 高 速 寄存 器 中 存储 ) 分 配 和 读 写 之 外 ， 还 可 以 为 后 续 进 一 
步 的 优化 手段 创建 条 件 。 
逃逸 分 析 在 Sun JDK 1.6 中 实现 ， 但 是 现在 这 项 优化 尚未 成 熟 ， 仍 有 巨大 的 改进 余地 。 
不 成 熟 的 原因 主要 是 不 能 保证 逃逸 分 析 的 性 能 收益 必定 高 于 它 的 消耗 。 如 果 要 百分之百 准 
确 地 判断 一 个 对 象 是 否 会 逃逸 ， 需 要 进行 数据 流 敏感 的 复杂 分 析 ， 来 确定 程序 各 个 分 支 执 
行 时 对 此 对 象 的 影响 。 这 是 一 个 相对 高 耗 时 的 过 程 ， 如 果 分 析 完 后 发 现 没有 几 个 不 逃逸 的 
对 象 ， 那 时 间 就 白白 浪费 了 ， 所 以 目前 虚拟 机 只 能 采用 不 那么 准确 、 时 间 压 力 相 对 较 小 的 
算法 来 完成 逃逸 分 析 。 还 有 一 点 是 基于 逃逸 分 析 的 一 些 优化 手段 ， 如 前 面 提 到 的 “ 栈 上 分 
配 ”， 由 于 HotSpot 虚拟 机 目前 的 实现 方式 导致 栈 上 分 配 实现 起 来 比较 复杂 ， 因 此 在 
HotSpot 中 暂时 还 没有 做 这 项 优化 。 
在 测试 结果 上 ， 实 施 逃 逸 分 析 后 的 程序 在 MicroBenchmarks 中 往往 能 运行 出 不 错 的 成 
绩 ， 但 是 在 实际 的 应 用 程序 ， 尤 其 是 大 型 程序 中 ， 反 而 发 现实 施 逃 逸 分 析 可 能 会 出 现 效果 
不 稳定 的 情况 ， 或 因 分 析 过 程 耗 时 却 无 法 有 效 地 判别 出 非 逃逸 对 象 而 导致 性 能 (即时 编译 的 
收益 ) 有 所 下 降 ， 所 以 即使 是 Server Compiler， 也 默认 不 开启 逃逸 分 析 ， 甚 至 在 某 些 版 本 
(如 JDK 1.6 Update 18) 中 还 曾经 短暂 地 完全 禁止 了 这 项 优化 。 
如 果 有 需要 ， 并 且 确 认 对 程序 运行 有 益 ， 用 户 可 以 使 用 参数 -XX:+DoEscapeAnalysis 
来 手动 开启 逃逸 分 析 ， 开 启 之 后 可 以 通过 参数 -XX:+PrintEscapeAnalysis 来 查看 分 析 结 果 。 
另外 ， 用 户 可 以 使 用 参数 -XX:+EliminateAllocations 来 开启 标量 蔡 换 ， 使 用 参数 
+XX:+EliminateLocks 来 开启 同步 消除 ， 使 用 参数 -XX:+PrintEliminateAllocations 来 查看 标 
量 的 替换 情况 。 
尽管 目前 逃逸 分 析 的 技术 仍 未 完全 成 熟 ， 它 却 是 即时 编译 器 优化 技术 一 个 重要 的 发 展 
方向 ， 在 日 后 的 虚拟 机 中 ， 逃 逸 分 析 技 术 肯 定 会 支撑 起 一 系列 实用 有 效 的 优化 技术 。 


15.4 Java 与 C/C++ 的 编译 器 对 比 


大 多 数 程序 员 都 认为 C/C++ 会 比 Java 语言 快 ， 甚 至 觉得 从 Java 语言 诞生 以 来 ，“ 执 
行 速度 缓慢 ”的 帽子 就 应 当 被 扣 在 头 项 ， 这 种 观点 的 出 现 是 由 于 Java 刚 出 现 的 时 候 即 时 初 
稿 完 成 之 前 ， 在 最 新 的 JDK 1.6 Update 23 的 Server Compiler 中 已 默认 开启 了 逃逸 分 析 。 

编译 技术 还 不 成 熟 ， 主 要 靠 解释 器 执行 的 Java 语言 性 能 确实 比较 低下 。 但 是 在 今天 即 
时 编译 技术 已 经 发 展 成 熟 ，Java 语言 有 可 能 在 速度 上 与 C/C++ 一 争 高 下 吗 ? 要 想 知道 这 
个 问题 的 答案 得 从 两 者 的 编译 器 谈 起 。 
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Java 与 C/C++ 的 编译 器 对 比 实际 上 代表 了 最 经 典 的 即时 编译 器 与 静态 编译 器 的 对 比 ， 
很 大 程度 上 也 决定 了 Java 与 C/C++ 的 性 能 对 比 的 结果 ， 因 为 无 论 是 C/C++ 还 是 Java 代 
码 ， 最 终 编译 之 后 被 机 器 执行 的 都 是 本 地 机 器 码 ， 哪 种 语言 的 性 能 更 高 ， 除 了 它们 自身 的 
API 库 实现 得 好 坏 以 外 ， 其 余 的 比较 就 成 了 一 场 “ 拼 编译 器 ”和 “ 拼 输 出 代码 质量 ”的 游 
戏 。 当 然 ， 这 种 比较 也 是 剔除 了 开发 效率 的 片面 对 比 ， 语 言 间 熟 优 熟 劣 、 谁 快 谁 慢 的 问题 
都 是 很 难 有 结果 的 争论 ， 下 面 我 们 就 回 到 正题 ， 看 看 这 两 种 语言 的 编译 器 各 有 何 种 优势 。 

Java 虚拟 机 的 即时 编译 器 与 C/C++ 的 静态 优化 编译 器 相 比 ， 可 能 会 由 于 下 列 这 些 原 因 
导致 输出 的 本 地 代码 有 一 些 劣势 (下 面 列举 的 也 包括 一 些 虚拟 机 执行 子 系统 的 性 能 劣势 ): 

(1) 因为 即时 编译 器 运行 占用 的 是 用 户 程序 的 运行 时 间 ， 具 有 很 大 的 时 间 压 力 ， 它 能 
提供 的 优化 手段 也 严重 受制 于 编译 成 本 。 如 果 编 译 速度 不 能 达到 要 求 ， 那 用 户 将 在 启动 程 
序 或 程序 的 某 部 分 察觉 到 重大 延迟 ， 这 点 使 得 即时 编译 器 不 敢 随 便 引 入 大 规模 的 优化 技 
术 ， 而 编译 的 时 间 成 本 在 静态 优化 编译 器 中 并 不 是 主要 的 关注 点 。 

(2) Java 语言 是 动态 的 类 型 安全 语言 ， 这 就 意味 着 需要 由 虚拟 机 来 确保 程序 不 会 违反 
语言 的 语义 或 访问 非 结构 化 内 存 。 在 实现 层面 上 看 ， 这 就 意味 着 虚拟 机 必须 频繁 地 进行 动 
态 检查 ， 如 实例 方法 访问 时 检查 空 指针 、 数 组 元 素 访问 时 检查 上 下 界 范围 、 类 型 转换 时 检 
查 继承 关系 ， 等 等 。 对 于 这 类 程序 代码 没有 明确 写 出 的 检查 行为 ， 尽 管 编译 器 会 努力 进行 
优化 ， 但 是 总 体 上 仍然 要 消耗 不 少 的 运行 时 间 。 

(3) Java 语言 中 虽然 没有 virutal 关键 字 ， 但 是 使 用 虚 方 法 的 频率 却 远 远大 干 C/C++ 语 
言 ， 这 就 意味 着 运行 时 对 方法 接收 者 进行 多 态 选 择 的 频率 要 远 远大 于 C/C++ 语言 ， 也 意味 
着 即时 编译 器 在 进行 一 些 优 化 (如 前 面 提 到 的 方法 内 联 ) 时 的 难度 要 远 远 大 于 C/C++ 的 静态 
优化 编译 器 。 

(4) Java 语言 是 可 以 动态 扩展 的 语言 ， 运 行 时 加 载 新 的 类 可 能 改变 程序 类 型 的 继承 关 
系 ， 这 使 得 很 多 全 局 的 优化 都 难以 进行 ， 因 为 编译 器 无 法 看 见 程 序 的 全 貌 ， 许 多 全 局 的 优 
化 措施 都 只 能 以 激进 优化 的 方式 来 完成 ， 编 译 器 不 得 不 时 刻 注意 并 随 着 类 型 的 变化 而 在 运 
行 时 撤销 或 重新 进行 一 些 优 化 。 

(5) Java 语言 中 对 象 的 内 存 分 配 都 是 在 堆 上 进行 的 ， 只 有 方法 中 的 局 部 变量 才能 在 栈 
上 分 配 。 而 C/C++ 的 对 象 则 有 多 种 内 存 分 配方 式 ， 既 可 能 在 堆 上 分 配 ， 又 可 能 在 栈 上 分 
配 ， 如 果 可 以 在 栈 上 分 配 线程 私有 的 对 象 ， 将 减轻 内 存 回 收 的 压力 。 另 外 ，C/C++ 中 主要 
由 用 户 程序 代码 来 回收 分 配 的 内 存 ， 这 就 不 存在 无 用 对 象 筛选 的 过 程 ， 因 此 效率 上 ( 仅 指 运 
行 效率 ， 排 除了 开发 效率 ) 也 比 垃圾 收集 机 制 要 高 。 

上 面 说 了 一 大 堆 Java 语言 相对 C/C++ 的 劣势 ， 倒 不 是 说 Java 就 真 的 不 如 C/C++， 相 
信 读 者 也 注意 到 了 ，Java 语言 的 这 些 性 能 上 的 劣势 都 是 为 了 换取 开发 效率 上 的 优势 而 付出 
的 代价 ， 动 态 安全 、 动 态 扩展 、 垃 圾 回收 这 些 “ 拖 后 腿 ” 的 特性 都 为 Java 语言 的 开发 效率 
作出 了 很 大 的 贡献 。 何 况 ， 还 有 Java 的 即时 编译 器 能 做 ， 而 C/C++ 的 静态 优化 编译 器 不 能 
做 的 优化 : 由 于 C/C++ 编译 器 的 静态 特性 ， 以 运行 期 性 能 监控 为 基础 的 优化 措施 它 都 无 法 
进行 ， 如 调用 频率 预测 (Call Frequency Prediction)、 分 支 频 率 预测 (Branch Frequency 
Prediction)、 裁 前 未 被 选择 的 分 支 (Untaken Branch Pruning) 等 ， 这 些 都 会 成 为 Java 语言 独 有 
的 性 能 优势 。 
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并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定律 代替 摩尔 定律 成 为 计算 机 性 能 发 
展 源 动力 的 根本 原因 ， 也 是 人 类 压榨 计算 机 运算 能 力 最 有 力 的 武器 。 本 章 将 详 
细 讲 解 JVM 内 存 模型 和 线程 的 基本 知识 ,介绍 虚拟 机 如 何 实现 多 线程 、 多 线程 
之 间 由 于 共享 和 竞争 数据 而 导致 的 一 系列 问题 及 解决 方案 ， 为 读者 学 习 后 面 的 
知识 打下 基础 。 
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权衡 优化 、 高 效 和 安全 的 最 优 方 案 


16.1 ” Java 的 多 线程 


线程 是 一 个 程序 内 部 的 顺序 控制 流 。 一 个 进程 相当 于 一 个 任务 ， 一 个 线程 相当 于 一 个 
任务 中 的 一 条 执行 路 径 。 多 进程 在 操作 系统 中 能 同时 运行 多 个 任务 (程序 ); 在 同一 个 应 用 
程序 中 有 多 个 顺序 流 同 时 执行 。Java 的 线程 是 通过 java.lang.Thread 类 来 实现 的 ，JVM 启 
动 时 会 有 一 个 由 主 方法 (public static void main0 分) 所 定义 的 线程 ， 可 以 通过 创建 Thread 的 
实例 来 创建 新 的 线程 ， 每 个 线程 都 是 通过 某 个 特定 Thread 对 象 所 对 应 的 方法 run0 来 完成 
其 操作 的 ， 方 法 run0 称 为 线程 体 ， 通 过 调用 Thread 类 的 start() 方 法 来 启动 一 个 线程 。 

多 任务 处 理 在 现代 计算 机 操作 系统 中 几乎 已 是 一 项 必 备 的 功能 了 。 在 许多 情况 下 ， 让 
计算 机 同时 去 做 几 件 事情 ， 不 仅 是 因为 计算 机 的 运算 能 力 强 大 ， 还 有 一 个 很 重要 的 原因 是 
计算 机 的 运算 速度 与 它 的 存储 和 通信 子 系统 速度 的 差距 太 大 ， 大 部 分 时 间 都 花 在 了 磁盘 
IJO、 网 络 通信 和 数据 库 访 问 上 。 如 果 不 希 望 处 理 器 在 大 部 分 时 间 里 都 处 于 等 待 其 他 资源 的 
状态 ， 就 必须 使 用 一 些 手 段 去 把 处 理 器 的 运算 能 力 “ 压 榕 ”出 来 ， 否 则 就 会 造成 很 大 的 
“浪费 ”， 而 让 计算 机 同时 处 理 几 项 任务 则 是 最 容易 想到 、 也 被 证 明 是 非常 有 效 的 “ 压 
榨 ” 手段。 

除了 充分 利用 计算 机 处 理 器 的 能 力 外 ， 一 个 服务 端 同时 对 多 个 客户 端 提供 服务 则 是 另 
一 个 更 具体 的 并 发 应 用 场景 。 衡 量 一 个 服务 性 能 的 高 低 好 坏 ， 每 秒 事务 处 理 数 
(Transactions Per Second，TPS) 是 最 重要 的 指标 之 一 ， 它 代表 着 一 秒 内 服务 端 平均 能 响应 的 
请 求 总 数 ， 而 TPS 值 与 程序 的 并 发 能 力 又 有 非常 密切 的 关系 。 对 于 计算 量 相同 的 任务 ， 程 
序 线程 并 发 协调 得 越 有 条 不 率 ， 效 率 自 然 就 会 越 高 ， 反之， 线程 之 间 频 繁 阻塞 甚至 死 锁 ， 
将 会 大 大 降低 程序 的 并 发 能 力 。 

服务 端 是 Java 语言 最 擅长 的 领域 之 一 ， 这 个 领域 的 应 用 占 了 Java 应 用 中 最 大 的 一 块 
份额 ， 不 过 如 何 写 好 并 发 应 用 程序 却 是 程序 开发 的 难点 之 一 ， 处 理 好 并 发 方面 的 问题 通常 
需要 更 多 的 经 验 。 幸 好 Java 语言 和 虚拟 机 提供 了 许多 工具 ， 把 并 发 编程 的 门槛 降低 了 不 
少 。 另 外 ， 各 种 中 间 件 服务 器 、 各 类 框架 都 努力 地 替 程 序 员 处 理 尽 可 能 多 的 线程 并 发 细 
节 ， 使 得 程序 员 在 编码 时 能 更 关注 业务 逻辑 ， 而 不 是 花费 大 部 分 时 间 去 关注 此 服务 会 同时 
被 多 少 人 调用 。 但 是 无 论语 言 、 中 间 件 和 框架 如 何 先进 ， 我 们 都 不 能 期 望 它 们 能 独立 完成 
并 发 处 理 的 所 有 事情 ， 了 解 并 发 的 内 幕 也 是 成 为 一 个 高 级 程序 员 不 可 缺少 的 课程 。 

一 般 来 说 ,我 们 把 正在 计算 机 中 执行 的 程序 叫做 “进程 ”(Process) ,而 不 将 其 称 为 程序 
(Program)。 所 谓 “ 线 程 ”(Thread)， 是 “进程 ”中 某 个 单一 顺序 的 控制 流 。 新 兴 的 操作 系 
统 ， 如 Mac、Windows NT、Windows 95 等 大 多 采用 多 线程 的 概念 ， 把 线程 视 为 基本 执行 
单位 ， 线 程 也 是 Java 中 的 相当 重要 的 组 成 部 分 之 一 。 

甚至 最 简单 的 Applet 也 是 由 多 个 线程 来 完成 的 。 在 Java 中 ， 任 何 一 个 Applet 的 paint(O) 
和 update() 方 法 都 是 由 AWT(Abstract Window Toolkib 绘 图 与 事件 处 理 线程 调用 的 ， 而 
Applet 主要 的 里 程 碑 方法 一 一 init0、start0、stop0 和 destory0 是 由 执行 该 Applet 的 应 用 调 
用 的 。 
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单线 程 的 概念 没有 什么 新 的 地 方 ， 真 正 有 趣 的 是 在 一 个 程序 中 同时 使 用 多 个 线程 来 完 
成 不 同 的 任务 。 某 些 地 方 用 轻 量 进程 (Lightweig ht Process) 来 代替 线程 .线程 与 真正 进程 的 相 
似 性 在 于 它们 都 是 单一 顺序 控制 流 。 然 而 线程 被 认为 轻 量 是 由 于 它 运行 于 整个 程序 的 上 下 
文 内 ， 能 使 用 整个 程序 共有 的 资源 和 程序 环境 。 

作为 单一 顺序 控制 流 ， 在 运行 的 程序 内 线程 必须 拥有 一 些 资源 作为 必要 的 开销 。 例 如 
必须 有 执行 堆栈 和 程序 计数 器 在 线程 内 执行 的 代码 只 在 它 的 上 下 文中 起 作用 ， 因 此 某 些 地 
方 用 “执行 上 下 文 ” 来 代替 “线程 ”。 


16.2 ”硬件 的 效率 与 一 致 性 


在 正式 讲解 Java 虚拟 机 并 发 相关 的 知识 之 前 ， 我 们 先 花 费 一 点 时 间 去 了 解 一 下 物理 计 
算 机 中 的 并 发 问题 ， 物 理 机 遇 到 的 并 发 问题 与 虚拟 机 中 的 情况 有 不 少 相似 之 处 ， 物 理 机 对 
并 发 的 处 理 方案 对 虚拟 机 的 实现 也 有 相当 大 的 参考 意义 。 

“让 计算 机 并 发 执行 若干 个 运算 任务 ”与 “更 充分 地 利用 计算 机 处 理 器 的 效能 ”之 间 
的 因果 关系 ， 看 起 来 顺理成章 ， 实 际 上 并 没有 想象 中 的 那么 容易 实现 ， 因 为 所 有 的 运算 任 
务 都 不 可 能 只 靠 处 理 器 “计算 ”就 能 完成 ， 至 少 与 内 存 的 交互 ， 如 读 取 运 算数 据 、 存 储 运 
算 结果 等 ， 就 是 很 难 消除 的 (不 能 仅仅 靠 寄存 器 来 解决 )。 由 于 计算 机 的 存储 设备 与 处 理 器 
的 运算 速度 之 间 有 着 几 个 数量 级 的 差距 ， 所 以 现代 计算 机 系统 都 不 得 不 加 入 一 层 读 写 速度 
尽 可 能 接近 处 理 器 运算 速度 的 高 速 缓存 (Cache) 来 作为 内 存 与 处 理 器 之 间 的 缓冲 : 将 运算 需 
要 使 用 到 的 数据 复制 到 缓存 中 ， 让 运算 能 快速 进行 ， 当 运算 结束 后 再 从 缓存 同步 回 内 存 之 
中 ， 这 样 处 理 器 就 无 须 等 待 缓慢 的 内 存 读 写 了 。 

基于 高 速 缓存 的 存储 交互 很 好 地 解决 了 处 理 器 与 内 存 的 速度 矛盾 ， 但 是 也 引入 了 新 的 
问题 : 缓存 一 致 性 (Cache Coherence)。 在 多 处 理 器 系统 中 ， 每 个 处 理 器 都 有 自己 的 高 速 组 
存 ， 而 它们 又 共享 同一 主 内 存 (Main Memory)。 当 多 个 处 理 器 的 运算 任务 都 涉及 同一 块 主 
内 存 区 域 时 ， 将 可 能 导致 各 自 的 缓存 数据 不 一 致 的 情况 ， 如 果真 的 发 生 这 种 情况 ， 那 同步 
回 到 主 内 存 时 以 谁 的 缓存 数据 为 准 呢 ? 为 了 解决 一 致 性 的 问题 ， 需 要 各 个 处 理 器 访问 缓存 
时 都 遵循 一 些 协议 ， 在 读 写 时 要 根据 协议 来 进行 操作 ， 这 类 协议 有 MSI、MESI (Illinois 
Protocol)、MOSI、Synapse、Firefly 及 Dragon Protocol， 等 等 。Java 虚拟 机 内 存 模型 中 定 
义 的 内 存 访问 操作 与 硬件 的 缓存 访问 操作 是 具有 可 比 性 的 。 

除 此 之 外 ， 为 了 使 得 处 理 器 内 部 的 运算 单元 能 尽量 被 充分 利用 ， 处 理 器 可 能 会 对 输入 
代码 进行 乱 序 执行 (Out-Of-Order Execution) 优 化 ， 处 理 器 会 在 计算 之 后 将 乱 序 执行 的 结果 
重组 ， 保 证 该 结果 与 顺序 执行 的 结果 是 一 致 的 ， 但 并 不 保证 程序 中 各 个 语句 计算 的 先后 顺 
序 与 输入 代码 中 的 顺序 一 致 ， 因 此 如 果 存 在 一 个 计算 任务 依赖 另外 一 个 计算 任务 的 中 间 结 
果 ， 那 么 其 顺序 性 并 不 能 靠 代码 的 先后 顺序 来 保证 。 与 处 理 器 的 乱 序 执行 优化 类 似 ，Java 
虚拟 机 的 即时 编译 器 中 也 有 类 似 的 指令 重 排序 (Instruction Reorder) 优 化 。 
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16.3 Java 内 存 模型 


不 同 的 平台 ， 内 存 模型 是 不 一 样 的 ， 但 是 JVM 的 内 存 模型 规范 是 统一 的 。 其 实 Java 
的 多 线程 并 发 问题 最 终 都 会 反映 在 Java 的 内 存 模型 上 ， 所 谓 线程 安全 无 非 是 要 控制 多 个 线 
程 对 某 个 资源 的 有 序 访问 或 修改 。 总 结 Java 的 内 存 模型 ， 要 解决 两 个 主要 的 问题 : 可见 性 
和 有 序 性 。 

我 们 都 知道 计算 机 有 高 速 缓存 的 存在 ， 处 理 器 并 不 是 每 次 处 理 数据 都 是 取 内 存 的 。 
JVM 定义 了 自己 的 内 存 模 型 ， 屏 蔽 了 底层 平台 内 存 管理 细节 ， 对 于 Java 开发 人 员 ， 要 清 
楚 在 JVM 内 存 模 型 的 基础 上 ， 如 果 解 决 多 线程 的 可 见 性 和 有 序 性 。 

那么 ， 何 谓 可 见 性 ? 多 个 线程 之 间 是 不 能 互相 传递 数据 通信 的 ， 它 们 之 间 的 沟通 只 能 
通过 共享 变量 来 进行 。Java 内 存 模 型 (JMM) 规 定 了 JVM 有 主 内 存 ， 主 内 存 是 多 个 线程 共享 
的 。 当 新 建 一 个 对 象 的 时 候 ， 也 是 被 分 配 在 主 内 存 中 ， 每 个 线程 都 有 自己 的 工作 内 存 ， 工 
作 内 存 存 储 了 主 存 的 某 些 对 象 的 副本 ， 当 然 线程 的 工作 内 存 大 小 是 有 限制 的 。 当 线程 操作 
某 个 对 象 时 ， 执 行 顺序 如 下 : 

(1) 从 主 存 复制 变量 到 当前 工作 内 存 (read and load)。 

(2) 执行 代码 ， 改 变 共享 变量 值 (use and assign)。 

(3) 用 工作 内 存 数据 刷新 主 存 相 关内 容 (store and write)。 


16.3.1 ” Java 内存 模 型 概述 


Java 平台 自动 集成 了 线程 以 及 多 处 理 器 技术 ， 这 种 集成 程度 比 Java 以 前 诞生 的 计算 
机 语言 要 厉害 很 多 ， 该 语言 针对 多 种 异 构 平 台 的 平台 独立 性 ， 而 使 用 的 多 线程 技术 支持 也 
是 具有 开拓 性 的 一 面 ， 有 时 候 在 开发 Java 同步 和 线程 安全 要 求 很 严格 的 程序 时 ， 往 往 容 易 
混淆 的 一 个 概念 就 是 内 存 模 型 。 究 竟 什 么 是 内 存 模型 ? 内 存 模型 描述 了 程序 中 各 个 变量 ( 实 
例 域 、 静 态 域 和 数组 元 素 ) 之 间 的 关系 ， 以 及 在 实际 计算 机 系统 中 将 变量 存储 到 内 存 和 从 内 
ne 对 象 最 终 是 存储 在 内 存 里 面 的 ， 这 点 没有 错 ， 但 是 编译 

运行 库 、 处 理 器 或 者 系统 缓存 可 以 有 特权 在 变量 指定 内 存 位 置 存储 或 者 取出 变量 

JVM 规范 定义 了 线程 对 主 存 的 操作 指令 : read、load、use、assign、store、write。 当 
一 个 共享 变量 在 多 个 线程 的 工作 内 存 中 都 有 副本 时 ， 如 果 一 个 线程 修改 了 这 个 共享 变量 ， 
那么 其 他 线程 应 该 能 够 看 到 这 个 被 修改 后 的 值 ， 这 就 是 多 线程 的 可 见 性 问题 。 那 么 ， 什 么 
是 有 序 性 呢 ? 线程 在 引用 变量 时 不 能 直接 从 主 内 存 中 引用 ， 如 果 线 程 工 作 内 存 中 没有 该 变 
量 , 则 会 从 主 内 存 中 拷贝 一 个 副本 到 工作 内 存 中 ， 这 个 过 程 为 read-load， 完 成 后 线程 会 引用 
该 副本 。 当 同一 线程 再 度 引 用 该 字段 时 .有 可 能 重新 从 主 存 中 获取 变量 副本 (read-load-use)， 
也 有 可 能 直接 引用 原来 的 副本 (use)， 也 就 是 说 read、load、use 的 顺序 可 以 由 JVM 实现 系 
统 决定 。 

线程 不 能 直接 为 主 存 中 中 字段 赋值 ， 它 会 将 值 指 定 给 工作 内 存 中 的 变量 副本 (assign)， 
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完成 后 这 个 变量 副本 会 同步 到 主 存储 区 (store-write)， 至 于 何 时 同步 过 去 ， 根 据 JVM 实现 
系统 决定 ， 有 该 字段 则 会 从 主 内 存 中 将 该 字段 赋值 到 工作 内 存 中 ， 这 个 过 程 为 read-load， 
完成 后 线程 会 引用 该 变量 副本 ， 当 同一 线程 多 次 重复 对 字段 赋值 时 ， 比 如 : 

for(int i=0;i<10;i++) 

线程 有 可 能 只 对 工作 内 存 中 的 副本 进行 赋值 ， 只 到 最 后 一 次 赋值 后 才 同步 到 主 存储 
区 ， 所 以 assign.store.weite 顺序 可 以 由 JVM 实现 系统 决定 。 假 设 有 一 个 共享 变量 x， 线 程 
a 执行 x=x+1。 从 上 面 的 描述 中 可 以 知道 x=x+1 并 不 是 一 个 原子 操作 ， 它 的 执行 过 程 如 
下 ; 

(1) 从 主 存 中 读 取 变量 x 副本 到 工作 内 存 。 

(2) 给 x 加 1。 

(3) 将 x 加 1 后 的 值 写 回 主 存 。 

如 果 另 外 一 个 线程 b 执行 x=x-1， 执 行 过 程 如 下 : 

(1) 从 主 存 中 读 取 变量 x 副本 到 工作 内 存 。 

(2) x 减 1。 

(3) 将 x 减 1 后 的 值 写 回 主 存 。 

那么 显然 ， 最 终 的 x 的 值 是 不 可 靠 的 。 假 设 x 现在 为 10， 线 程 a 加 1， 线程 b 减 1， 
从 表面 上 看 ， 似 乎 最 终 x 还 是 为 10， 但 是 多 线程 情况 下 会 有 这 种 情况 发 生 : 

口 ”线程 a 从 主 存 读 取 x 副本 到 工作 内 存 ， 工 作 内 存 中 x 值 为 10。 
线程 b 从 主 存 读 取 x 副本 到 工作 内 存 ， 工 作 内 存 中 x 值 为 10。 
线程 a 将 工作 内 存 中 x 加 1， 工 作 内 存 中 x 值 为 11。 
线程 a 将 x 提交 主 存 中 ， 主 存 中 x 为 11。 
线程 b 将 工作 内 存 中 x 值 减 1， 工 作 内 存 中 x 值 为 9。 

口 ”线程 b 将 x 提交 到 中 主 存 中 ， 主 存 中 x 为 9。 

同样 ，x 有 可 能 为 11， 如 果 x 是 一 个 银行 账户 ， 线 程 a 存款 ， 线 程 b 扣 款 ， 显 然 这 样 
是 有 严重 问题 的 ， 要 解决 这 个 问题 ， 必 须 保证 线程 a 和 线程 b 是 有 序 执行 的 ， 并 且 每 个 线 
程 执行 的 加 1 或 减 1 是 一 个 原子 操作 。 看 看 下 面 的 代码 : 


public class Account { 


OOOO 


private int balance; 


public Account (int balance) { 
this.balance = balance; 
} 


public int getBalance() { 
return balance; 
} 


public void add(int num) { 
balance = balance + num; 


ion, 


public void withdraw (int num) { 
balance = balance - num; 
} 


public static void main(String[] args) throws InterruptedException { 
Account account = new Account (1000); 
Thread a = new Thread (new AddThread(account, 20), "add"™); 
Thread b = new Thread (new WithdrawThread(account, 20), "withdraw"); 
a-start (}'s 
b=starttys 
a.join(); 
bvjoin(}s 
System.out .println (account .getBalance ()); 
} 


static class AddThread implements Runnable { 
Account account; 
int amount; 


public AddThread (Account account, int amount) { 
this.account = account; 
this.amount = amount; 

} 


public void run() { 
for (int i = 0; i < 200000; i++) { 
account .add (amount); 


} 


static class WithdrawThread implements Runnable { 
Account account; 
int amount; 


public WithdrawThread (Account account, int amount) { 
this.account = account; 
this.amount = amount; 

} 


public void run() { 
for (int i = 0; i < 100000; i++) { 
account .withdraw (amount); 
E 


} 


第 一 次 执行 结果 为 10200， 第 二 次 执行 结果 为 1060， 每 次 执行 的 结果 都 是 不 确定 的 ， 

因为 线程 的 执行 顺序 是 不 可 预见 的 。 这 是 Java 同步 产生 的 根源 ，synchronized 关键 字 保证 

了 多 个 线程 对 于 同步 块 是 互 斥 的 ，synchronized 作为 一 种 同步 手段 ， 解 决 Java 多 线程 的 执 
行 有 序 性 和 内 存 可 见 性 ， 而 volatile 关键 字 之 解决 多 线程 的 内 存 可 见 性 问题 。 
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16.3.2 主 内 存 与 工作 内 存 


Java 内 存 模型 的 主要 目标 是 定义 程序 中 各 个 变量 的 访问 规则 ， 即 在 虚拟 机 中 将 变量 存 
储 到 内 存 和 从 内 存 中 取出 变量 这 样 的 底层 细节 。 此 处 的 变量 (Variable) 与 Java 编程 中 所 说 的 
变量 略 有 区 别 ， 它 包括 了 实例 字段 、 静 态 字 段 和 构成 数组 对 象 的 元 素 ， 但 是 不 包括 局 部 变 
量 与 方法 参数 ， 因 为 后 者 是 线程 私有 的 ， 不 会 被 共享 ， 自 然 就 不 存在 竞争 问题 。 为 了 获得 
较 好 的 执行 效能 ，Java 内 存 模型 并 没有 限制 执行 引擎 使 用 处 理 器 的 特定 寄存 器 或 缓存 来 和 
主 内 存 进 行 交 互 ， 也 没有 限制 即时 编译 器 调整 代码 执行 顺序 这 类 权利 。 

Java 内 存 模型 规定 了 所 有 的 变量 都 存储 在 主 内 存 (Main Memory) 中 (此 处 的 主 内 存 与 介 
绍 物理 硬件 时 的 主 内 存 名 字 一 样 ， 两 者 也 可 以 互相 类 比 ， 但 此 处 仅 是 虚拟 机 内 存 的 一 部 
分 )。 每 条 线程 还 有 自己 的 工作 内 存 (Working Memory， 可 与 前 面 所 讲 的 处 理 器 高 速 缓存 类 
比 )， 线 程 的 工作 内 存 中 保存 了 被 该 线程 使 用 到 的 变量 的 主 内 存 副本 拷贝 ， 线 程 对 变量 的 所 
有 操作 ( 读 取 、 赋 值 等 ) 都 必须 在 工作 内 存 中 进行 ， 而 不 能 直接 读 写 主 内 存 中 的 变量 。 不 同 
的 线程 之 间 也 无 法 直接 访问 对 方 工作 内 存 中 的 变量 ， 线 程 间 变 量 值 的 传递 均 需要 通过 主 内 
存 来 完成 ， 线 程 、 主 内 存 、 工 作 内 存 三 者 的 交互 关系 如 图 16-1 所 示 。 


Java 线 程 3 工作 内 存 S 保存 / 载 入 操作 


主 内 存 


图 16-1 线程 、 主 内 存 和 工作 内 存 之 间 的 交互 关系 


这 里 所 讲 的 主 内 存 、 工 作 内 存 与 本 书 第 2 章 所 讲 的 Java 内 存 区 域 中 的 Java 堆 、 栈 、 
方法 区 等 并 不 是 同一 个 层次 的 内 存 划分 。 如 果 两 者 一 定 要 勉强 对 应 起 来 ， 那 从 变量 、 主 内 
存 、 工 作 内 存 的 定义 来 看 ， 主 内 存 主 要 对 应 于 Java 堆 中 对 象 的 实例 数据 部 分 ， 而 工作 内 存 
则 对 应 于 虚拟 机 栈 中 的 部 分 区 域 。 从 更 低 的 层次 来 说 ， 主 内 存 就 是 硬件 的 内 存 ， 而 为 了 获 
取 更 好 的 运行 速度 ， 虚 拟 机 及 硬件 系统 可 能 会 让 工作 内 存 优先 存储 于 寄存 器 和 高 速 组 
存 中 。 


16.3.3 内存 间 交互 操作 


关于 主 内 存 与 工作 内 存 之 间 具 体 的 交互 协议 ， 即 一 个 变量 如 何 从 主 内 存 拷贝 到 工作 内 
存 、 如 何 从 工作 内 存 同步 回 主 内 存 之 类 的 实现 细节 ，Java 内 存 模型 中 定义 了 以 下 8 种 操作 
来 完成 @: 

口 lock( 锁 定 ): 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 标识 为 一 条 线程 独占 的 状态 。 

口 “unlock( 解 锁 ): 作用 于 主 内 存 的 变量 ， 它 把 一 个 处 于 锁定 状态 的 变量 释放 出 来 ， 释 

放 后 的 变量 才 可 以 被 其 他 线程 锁定 。 
口 ”read( 读 取 ): 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 的 值 从 主 内 存 传输 到 线程 的 工作 


ly 
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内 存 中 ， 以 便 随 后 的 load 动作 使 用 。 
load( 载 入 ): 作用 于 工作 内 存 的 变量 ， 它 把 read 操作 从 主 内 存 中 得 到 的 变量 值 放 
人 工作 内 存 的 变量 副本 中 。 
use( 使 用 ): 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 的 值 传递 给 执行 引 
擎 ， 每 当 虚 拟 机 遇 到 一 个 需要 使 用 到 变量 的 值 的 字 节 码 指令 时 将 会 执行 这 个 
操作 。 
assign( 赋 值 ): 作用 于 工作 内 存 的 变量 ， 它 把 一 个 从 执行 引擎 接收 到 的 值 赋值 给 工 
作 内 存 的 变量 ， 每 当 虚 拟 机 遇 到 一 个 给 变量 赋值 的 字 节 码 指令 时 执行 这 个 操作 。 
store( 存 储 ): 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 的 值 传送 到 主 内 
存 中 ， 以 便 随 后 的 write 操作 使 用 。 
write( 写 入 ): 作用 于 主 内 存 的 变量 ， 它 把 store 操作 从 工作 内 存 中 得 到 的 变量 的 值 
放 入 主 内 存 的 变量 中 。 
如 果 要 把 一 个 变量 从 主 内 存 复 制 到 工作 内 存 ， 那 就 要 按 顺 序 地 执行 read 和 load 操 
作 ， 如 果 要 把 变量 从 工作 内 存 同步 回 主 内 存 ， 就 要 按 顺 序 地 执行 store 和 write 操作 。 注 
意 ，Java 内 存 模型 只 要 求 上 述 两 个 操作 必须 按 顺序 执行 ， 而 没有 保证 必须 是 连续 执行 。 也 
就 是 说 read 与 load 之 间 、store 与 write 之 间 是 可 插入 其 他 指令 的 ， 如 对 主 内 存 中 的 变量 
a、b 进行 访问 时 ， 一 种 可 能 出 现 的 顺序 是 read a、read b、load b、load a。 除 此 之 外 ，Java 
内 存 模型 还 规定 了 在 执行 上 述 8 种 基本 操作 时 必须 满足 如 下 规则 : 
口 不 允许 read 和 load、store 和 write 操作 之 一 单独 出 现 ， 即 不 允许 一 个 变量 从 主 内 
存 读 取 了 但 工作 内 存 不 接受 ， 或 者 从 工作 内 存 发 起 回 写 了 但 主 内 存 不 接受 的 情况 
出 现 。 
口 不 允许 一 个 线程 丢弃 它 的 最 近 的 assign 操作 ， 即 变量 在 工作 内 存 中 改变 了 之 后 必 
须 把 该 变化 同步 回 主 内 存 。 
口 “ 不 允许 一 个 线程 无 原因 地 (没有 发 生 过 任何 assign 操作 ) 把 数据 从 线程 的 工作 内 存 
同步 回 主 内存 中 。 
口 一 个 新 的 变量 只 能 在 主 内 存 中 “诞生 ”， 不 允许 在 工作 内 存 中 直接 使 用 一 个 未 被 
初始 化 (load 或 assign) 的 变量 ， 换 句 话说 就 是 对 一 个 变量 实施 use 和 store 操作 之 
前 ， 必 须 先 执行 过 了 assign 和 load 操作 。 
口 一 个 变量 在 同一 个 时 刻 只 允许 一 条 线程 对 其 进行 lock 操作 ， 但 lock 操作 可 以 被 
同一 条 线程 重复 执行 多 次 ， 多 次 执行 lock 后 ， 只 有 执行 相同 次 数 的 unlock 操 
作 ， 变 量 才 会 被 解锁 。 
口 ” 如 果 对 一 个 变量 执行 lock 操作 ， 将 会 清空 工作 内 存 中 此 变量 的 值 ， 在 执行 引擎 使 
用 这 个 变量 前 ， 需 要 重新 执行 load 或 assign 操作 初始 化 变量 的 值 。 
口 ” 如 果 一 个 变量 事先 没有 被 lock 操作 锁定 ， 则 不 允许 对 它 执行 unlock 操作 ;也 不 
允许 去 unlock 一 个 被 其 他 线程 锁定 住 的 变量 。 
口 ” 对 一 个 变量 执行 unlock 操作 之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 中 (执行 store 和 
wiite 操作 )。 
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如 果 一 个 变量 声明 为 volatile 类 型 ， 那 么 每 个 线程 对 该 变量 实施 的 动作 有 以 下 附加 的 
规则 ， 假 定 T 表示 一 个 线程 ，V，W 表示 volatile 类 型 变量 。 

(1) 只 有 当 线 程 T 对 变量 V 执行 的 前 一 个 动作 是 load 的 时 候 ， 线 程 T 才能 对 变量 V 
执行 use 动作 ; 并且 ， 只 有 当 线程 T 对 变量 V 执行 的 后 一 个 动作 是 use 的 时 候 ， 线程 了 才 
能 对 变量 V 执行 load 动作 。 线 程 T 对 就 是 V 的 use 动作 可 以 认为 是 和 线程 对 变量 V 的 
load 动作 相应 的 read 动作 相关 联 (这 样 可 以 保证 看 其 他 线程 对 变量 V 所 做 的 修改 后 的 值 ， 
即使 用 时 先 去 从 主 内 存 中 加 载 )。 

(2) 只 有 当 线 程 T 对 变量 V 执行 的 前 一 个 动作 是 assign 的 时 候 ， 线 程 工 才能 对 变量 V 
执行 store 动作 ;并且 ， 只 有 当 线 程 T 对 变量 V 执行 的 后 一 个 动作 是 store 的 时 候 ， 线 程 T 
才能 对 变量 V 执行 assign 动作 。 线 程 T 对 就 是 V 的 assign 动作 可 以 认为 是 和 线程 了 对 变 
量 V 的 store 动作 相应 的 write 动作 相关 联 (这 样 可 以 保证 其 他 线程 可 以 看 到 自己 对 变量 V 
所 做 的 修改 ， 即 修改 后 写 回 主 内存 中 )。 

(3) 假定 动作 A 是 线程 T 对 变量 V 实施 的 use 或 assign 动作 ， 假 定 动作 下 是 和 动作 A 
相关 联 的 load 或 store 动作 ， 假 定 动作 P 是 和 动作 相应 的 对 变量 V 的 read 或 write 动 
作 ; 类 似 的 ， 假 定 动作 B 是 线程 了 对 变量 W 实施 的 use 或 assign 动作 ， 假 定 动作 G 是 和 
动作 B 相关 联 的 load 或 store 动作 ， 假 定 动作 Q 是 和 动作 G 相应 的 对 变量 W 的 read 或 
write 动作 。 如 果 A 先 于 B， 那 么 P 先 于 Q( 不 严格 的 : 为 了 一 个 线程 T， 主 内 存 实施 对 给 
定 的 volatile 变量 的 主 拷贝 的 动作 必须 遵循 和 线程 执行 时 要 求 的 一 样 的 先后 顺序 。 也 即将 
V、W 变量 写 回 到 主 内 存 的 顺序 与 程序 代码 行 对 V、W 赋值 先后 顺序 一 样 ;线程 将 V、W 
变量 从 主 内 存 读 取出 来 的 顺序 与 程序 代码 行 对 V、W 使 用 先后 顺序 一 样 。 即 volate 禁止 了 
变量 间 的 重新 排序 问题 )。 该 规则 进一步 加 强 了 多 线程 访问 共享 变量 的 安全 性 ， 这 条 规则 是 
针对 多 线程 提出 的 。 

对 声明 为 volatile 的 变量 的 规则 有 效 地 保证 了 : 线程 对 一 个 声明 为 volatile 的 变量 的 
每 个 use 或 assign 动作 只 要 访问 主 内 存 一 次 ， 并 且 依 照 线程 的 执行 语义 所 指定 的 次 序 访问 
主 内 存 ， 然 而 ， 对 没有 声明 为 volatile 的 变量 的 read 或 write 动作 ， 这 样 的 内 存 动作 是 没 
有 次 序 限制 的 。 

volatile 的 变量 除了 具有 可 见 性 外 ， 还 禁止 了 多 个 变量 间 的 Reordering。 

请 看 下 面 的 代码 : 


Class Samplef 
int a=1,b=27 
void hither(){ 
a=b; 
} 


void yon(){ 


ass， 


让 我 们 考虑 调用 hither 的 线程 ， 按 照 规 则 ， 该 线程 必须 执行 变量 b 的 use 动作 ， 在 它 
后 面 要 执行 变量 a 的 assign 动作 ， 这 是 对 hither 的 最 低 要 求 ( 即 同一 线程 内 一 定 是 按照 程序 
语义 顺序 来 执行 )。 
现在 线程 对 变量 b 的 第 一 个 动作 不 能 为 use， 但 是 可 以 为 assign 或 load。 这 里 对 b 的 
一 个 assign 动作 不 可 能 发 生 ， 因 为 这 里 根本 就 没有 赋值 调用 ， 所 以 这 里 只 有 对 变量 b 的 
load 动作 。 而 线程 对 这 个 load 动作 必须 有 一 个 更 早 的 主 内 存 对 变量 b 的 read 动作 。 
在 对 变量 a 进行 assign 动作 后 ， 线 程 可 选 地 (因为 没有 使 用 同步 ) 存 储 变量 a 的 值 ， 如 
果 线 程 要 存储 这 个 值 ， 那 么 线程 实施 store 动作 ， 并 且 主 内 存 接着 实施 变量 a 的 write 动 
作 。 调 用 方法 yon 的 线程 的 情况 是 类 似 的 ， 只 是 a 和 b 交换 了 各 自 的 角色 。 
假定 ha 和 hb 是 调用 hither 的 线程 的 变量 a 和 的 工作 拷贝 ，ya 和 yb 是 调用 yon 线程 
的 变量 a 和 b 的 工作 拷贝 ,，ma 和 mb 是 主 内 存 中 变量 a 和 变量 b 的 主 拷 贝 ， 初始 化 
ma=1，mb=2， 下 面 是 动作 的 可 能 结果 : 
(1) ha=2，hb=2，ya=2，yb=2，ma=2，mb=2( 结 果 是 b 复制 给 了 a)。 
(2) ha=1，hb=1，ya=1，yb=1，ma=1，mb=1( 结 果 是 a 复制 给 了 b)。 
(3) ha=2，hb=2，ya=1，yb=1，ma=2，mb=1( 结 果 是 a、b 交换 了 )。 
使 用 以 下 程序 进行 测试 : 
class Sample { 
和 不 管 a,b 是 否 使 用 volatile 修饰 ， 都 会 出 现 a、b 值 交换 。 因 为 a=b、b=a 并 不 是 原子 性 
* 的 ， 因 为 这 两 条 语句 都 会 涉及 使 用 与 赋值 两 个 动作 ， 完 全 有 可 能 在 访问 操作 后 切换 到 
* 另 一 线程 ， 而 volatile 并 不 像 synchronized 那样 具有 原子 特性 
全 int a 
Volatile int b 


Void hither() { 
= 


1; 
2; 


} 
synchronized void yon() { 
b= a; 
} 
} 
public class Test { 
public static void main(string[] args) throws Exception { 
while (!Thread.currentThread () .isInterrupted()) { 
final Sample s = new Sample(); 
final Thread hither = new Thread() { 
public void run() { 
s.hither(); 
} 
}; 
final Thread yon = new Thread() { 
public void run() { 
5s.yon(); 
} 
] 
hither.start (); 
yon.start (); 
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new Thread() { 
public void run() { 
try { 
hither.join(); 
yon.join(); 
} catch (InterruptedException e) { 
e.printstackTrace (); 
} 
If (90a = sD) 
// 某 次 打印 结果 Thread-332984: a=2 b=1 
System.out .println (this.getName() + ": ar" + s.a+"b"+ s.b); 
System.exit (0); 
. 
1 
}.start (); 
Thread.yield(); 


E 
} 
上 面 使 用 volatile 同时 修改 这 两 个 变量 还 是 不 行 的 ， 除 非 两 个 方法 同时 ( 注 :， 只 一 个 方 
法 使 用 也 是 不 管用 的 ) 使 用 synchronized: 


class Sample { 
int a= 1; 


int b = 2; 
synchronized void hither() { 
全 二. 


en void yon() { 
I = a 
} 
} 
lock 和 unlock 动作 对 主 内 存 的 动作 次 序 提出 了 更 多 的 限制 。 在 一 个 线程 的 lock 动作 和 
unlock 动作 之 间 ， 另 一 个 线程 不 能 实施 lock 动作 ， 而 且 ，unlock 动作 前 需要 实施 store 动 
作 和 write 动作 ， 下 面 是 仅 可 能 发 现 的 顺序 ， 从 结果 看 出 要 么 是 a， 要么 是 b， 不 可 能 出 
现 两 都 交换 的 情况 : 
(1) ha=2，hb=2，ya=2，yb=2，ma=2，mb=2( 结 果 是 b 复制 给 了 a)。 
(2) ha=1，hb=1，ya=1，yb=1，ma=1，mb=1( 结 果 是 a 复制 给 了 b)。 
由 此 可 见 ，volatile 字段 被 用 来 在 线程 之 间 Communicate State( 交 流 规则 )。 任 意 线程 所 
read 的 volatile 字段 的 值 都 是 最 新 的 。 原 因 有 以 下 有 4 点: 
(1) 编译 器 和 JVM 会 阻止 将 volatile 字段 的 值 放 入 处 理 器 寄存 器 (Register); 
(2) 在 write volatile 字段 之 后 ， 其 值 会 被 flush 出 处 理 器 cache， 写 回 memory; 
(3) 在 read volatile 字段 之 前 ， 会 invalidate( 验 证 ) 处 理 器 cache。 因 此 ， 上 述 两 条 便 保 
证 了 每 次 read 的 值 都 是 memory 中 的 ， 即 具有 “可 见 性 ”这 一 特性 。 
(4) 禁止 reorder( 重 排序 ， 即 与 原 程序 指定 的 顺序 不 一 致 ) 任 意 两 个 volatile 变量 ， 并 且 
同时 严格 限制 (尽管 没有 禁止 )reorder volatile 变量 周围 的 非 volatile 变量 。 这 一 点 即 volatile 
具有 变量 的 “顺序 性 ”， 即 指令 不 会 重新 排序 ， 而 是 按照 程序 指定 的 顺序 执行 。 


i p> 
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注意 : 在 旧 的 内 存 模型 下 ， 对 volatile 修改 的 变量 的 访问 顺序 不 能 进行 重新 排序 ， 但 
可 以 对 非 volatile 变量 进行 排序 ， 但 这 样 又 可 能 还 是 会 导致 volatile 变量 可 见 性 问题 ， 所 以 
老 的 旧 内 存 模型 没有 从 根本 上 解决 volatile 变量 的 可 见 性 问题 。 在 新 的 内 存 模型 下 ， 仍 然 
是 不 允许 对 volatile 变量 进行 reorder 的 ， 不 同 的 是 再 也 不 轻易 (虽然 没有 完全 禁止 掉 ) 允 许 
对 它 周 围 的 非 volatile 变量 进行 排序 。 

由 于 上 述 第 (4) 条 中 对 volatile 字段 以 及 周围 非 volatile 字段 (或 变量 )reorder 的 限制 ， 如 
下 程序 中 ， 假 设 线程 A 正在 执行 reader 方法 ， 同 时 ， 线 程 B 正在 执行 writer 方法 。 线 程 
B 完成 对 volatile 字段 v 的 赋值 后 ， 相 应 的 结果 被 写 回 内 存 。 如 果 此 时 线程 A 便 得 到 的 
Vv 的 值 正好 为 tue， 那 么 线程 A 也 可 以 安全 地 引用 x 的 值 。 然 而 ， 需 要 注意 的 是 ， 假 如 v 
不 是 volatile 的 ， 那 么 上 述 结果 就 不 一 定 了 ， 因 为 x 和 v 赋值 的 顺序 可 能 被 reorder。 


class VolatileSamplel { 
int x = 0; 
volatile boolean v = false; 


public void writer() { 
X = 427 
v= traes 

} 


public void reader() { 
/* 由 于 volatile 的 特点 ， 这 里 要 想 v 为 true， 则 x 的 肯定 已 经 执行 赋值 (assign) 动作 
* 且 已 写 回 (writer) 主 内 存 了 ， 所 以 不 会 出 现 v=true，x=0 的 情形 。 但 时 ， 如 果 这 里 先 
* 访问 的 是 x 变量 ， 则 由 于 volatile 不 具有 原子 性 ， 则 还 是 会 出 现 v=true，x=0 的 情形 ， 


* 具体 请 看 后 面 测试 
eg 
if (v = true) { 


//uses x - 确保 能 看 见 42 . 
1 
} 

} 

假设 一 个 线程 调用 writer， 一 个 线程 调用 reader。 写 线程 将 V 写 回 到 主 内 存 中 ， 读 线 
程 从 主 内 存 中 获取 v。 因 此 ， 如 果 读 的 线程 能 够 看 到 v 的 值 为 tue， 这 就 能 确保 该 读 线程 
能 看 到 x 的 值 为 42， 因 为 x 是 在 v 前 面 赋值 ， 所 以 也 会 先 写 回 到 内 存 。 如 果 v 不 是 
volatile， 编 译 器 就 可 能 在 写 回 到 主 内 存 时 对 v 与 x 进行 reader， 这 样 的 就 可 能 在 读 的 线程 
看 到 v 为 tue 时 ，x 却 还 是 为 0， 因为 写 线程 对 写 回 主 内 存 动作 进行 重新 reader 过 了 。 

而 下 面 是 对 volatile 变量 的 测试 : 


class VolatileSample2 { 
1 
volatile boolean V = false; 
String result; 


public void writer() { 
= 2 
了 = troes 
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public void reader() { 

/* 

* 如 果 是 result="x="+x+", Vv="+v;， 则 快 就 会 出 现 x=0, v=true 这 样 的 结果 ， 因 为 这 
* 条 语句 完全 可 能 先 访问 x 后 ， 另 外 线程 再 执行 writer 方法 ， 待 writer 方法 执行 完成 后 ， 

* 再 接着 访问 v， 此 时 就 会 出 现 x=0, v=true 的 结果 ; 

* 但 如 果 是 result="v="+v+", x="+x;， 则 要 想 出 现 v=true, x=0 的 结果 ， 则 一 定 要 等 
* Writer 方法 执行 完 并 写 回 到 主 内 存 后 再 执行 reader 方法 ， 由 于 声明 的 是 volatile 变 
* 量 ，volatile 变量 会 禁止 reorder 任意 两 个 者 volatile 变量 ， 并 且 同 时 严格 限制 

* reorder volatile 变量 周围 的 非 volatile 变量 ， 所 以 由 于 x 比 v 前 赋值 ， 则 写 回 主 
* 存 时 也 会 一 定 按照 此 顺序 ， 所 以 当 v 为 true 时 ， 则 主 存 中 的 x 肯定 是 42， 绝 不 会 是 0 ( 

* 这 里 不 要 注意 的 是 ，volatile 的 变量 也 会 在 读 取 主 内 存 时 严格 按照 程序 的 顺序 执行 ， 

* 所 以 这 里 根本 不 会 先 访问 x 再 v 的 可 能 ， 如 果 这 那样 ， 则 也 会 出 现 v=true, x=0 的 结果 ) 。 

* 这 里 只 将 x 声明 成 volatile 其 结果 也 是 一 样 的。 当然 如 果 两 个 都 声明 成 volatile 时 ， 

* 会 更 安全 ， 因 为 这 里 会 完全 “禁止 ” 重 排 ， 而 一 个 的 话 只 是 “严格 限制 ”而 已 ， 可 能 还 是 

* 不 会 很 安全 ， 所 以 一 般 两 个 都 设置 为 最 安全 。 


* 当 x,V 都 是 volatile 时 ， result="x="+x+",V="+V; 执 行 的 结果 还 是 有 可 能 为 

* x=0,Vv=true， 因为 volatile 只 是 保证 了 可 见 性 与 顺序 性 两 个 特点 为 ， 但 并 不 能 保证 
* 原子 性 。 此 种 情况 下 要 得 到 x=0, v=true， 只 需 reader 方法 先 执 行 ， 等 访问 x 完 后 而 v 
* 还 未 访问 时 ， 开 始 调试 writer 方法 ， 待 writer 整个 方法 执行 完 后 并 将 x, v 写 回 主 内 存 
* 后 ， 再 执行 reader 方法 ， 继 续 访问 v， 此 时 的 结 果 就 是 x=0, v=true。 另外 ， 

* result="x="+x+",V="+V; 也 会 严格 按照 程序 的 顺序 来 执行 访问 操作 ( 即 volatile 不 
* 只 是 在 写 回 内 存 时 是 按 程序 语义 的 执行 顺序 来 执行 ， 在 读 的 时 候 也 是 这 样 要 按照 程序 

* 的 访问 顺序 来 ， 但 如 果 不 是 volatile 变量 时 ， 则 read 动作 就 可 能 不 会 按照 程序 顺序 来 
* 执行 ， 但 这 好 像 对 纯粹 的 访问 操作 没有 什么 影响 ， 这 好 只 有 访问 操作 的 不 变 对 象 一 样 ， 

* 不 会 出 现 线程 不 安全 的 问题 ) ， 即 先 访问 x 后 再 能 访问 v， 但 这 绝 不 是 原子 性 的 ， 很 

* 有 可 能 从 他 们 中 间 切换 到 其 他 线程 。 


* 另外 ， 在 测试 的 过 程 中 发 现 writer 方法 的 原子 性 要 比 reader 的 原子 性 要 强 ， 即 多 个 访 
* 问 操作 在 一 起 不 如 多 个 赋值 语句 原子 性 强 

SS 

TesaiE = "R= 和 生 VN=" 寺 VS 

//result = "v=" + V+ ",X=" + 和 7 


} 


public class VolatileTest { 
public static void main(String[] args) { 
while (!Thread.currentThread () .isInterrupted()) { 
final Volatilesample2 s = new VolatileSample?2(); 
final Thread Ww = new Thread(){ 
public void run() { 
s.writer(); 
| 
] 7 


final Thread r = new Thread(){ 
public void run() { 
s.reader (); 


vas 以 机 开发 : 


= 权衡 优化 、 高 效 和 安全 的 最 优 方案 


r- Start()s? 
w.start (); 
new Thread(){ 
public void run() { 
Er 
Ww-.jJoin(); 
下 On 
} catch (InterruptedException e) { 
e.printstackTrace () 7 
} 
if (s.result.equals ("x=0,v=true")) { 
System.out.pPrintln(this.getName() + " "+ 
s.result); 
System.exit (0); 
} 
} 
Vstart{)y 


Thread.yield(); 


} 
} 


双重 检测 在 新 的 内 存 模 型 下 能 很 好 地 工作 吗 ? 看 下 面 的 代码 : 


private static Something instance = null; 


public Something getInstance() { 
if (instance == null) { 
synchronized (this) { 
if (instance == null) 
instance = new Something();//1 
} 
} 
return instance; 
} 


首先 ， 如 果 上 面 程 序 不 加 任何 修改 ， 这 个 在 旧 的 或 是 新 的 内 存 模型 下 都 不 能 正确 的 工 
作 。 上 面 程 序 /1 处 在 多 线程 的 情况 下 会 有 问题 ， 如 果 一 个 线程 在 /1 处 已 调用 完 构 造 
器 ， 但 Something 的 实例 域 可 能 还 没有 被 写 回 到 内 存 ， 而 在 这 之 前 会 将 创建 好 的 对 象 (但 并 
非 初 始 化 完全 的 对 象 ， 因 为 没有 将 它 的 实例 域 完全 写 回 到 主 内 存 ) 赋 值 给 了 instance 引用 ， 
这 样 另 一 个 线程 拿 到 的 instance 所 指向 的 对 象 其 实 是 不 完整 的 ， 即 所 指向 的 对 象 的 实例 域 
还 不 可 见 ， 这 样 在 使 用 这 个 instnace 时 就 会 有 问题 。 在 1.5 或 之 后 的 版 本 中 ， 我 们 可 以 将 
instance 设置 为 volatile 就 可 以 了 ， 这 样 就 会 确保 将 实例 域 的 数据 写 回 到 主 内 存 的 动作 在 将 
实例 赋值 给 instance 引用 动作 之 前 发 生 ( 即 volatile 的 happens-before 规则 )， 所 以 这 样 就 确 
保 了 在 使 用 前 对 象 已 完全 初始 化 完成 。 

而 在 新 的 内 存 模型 下 怎么 才能 使 用 final 域 正 常 的 工作 呢 ? JSR 133 新 的 目标 中 提出 了 
一 个 初始 化 安全 的 新 保障 : 如 果 一 个 对 象 被 安全 、 适 当地 构造 (在 构造 器 中 将 当前 正在 构造 
的 对 象 this 暴露 给 外 界 是 不 安全 的 ，“ 安 全 构造 ”技术 请 参考 这 里 )， 这 样 其 他 线程 可 以 在 
不 使 用 同步 的 情况 下 看 到 该 对 象 在 构造 器 里 设置 的 final 域 的 值 。 在 构造 期 间 ， 不 要 公布 


EE 
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“this” 引 用 ， 即 在 构造 函数 完成 之 前 ， 使 this 引用 暴露 给 另 一 个 线程 ， 这 种 暴露 可 能 是 
显 式 的， 也 可 能 是 隐 式 的 。 
class FinalFieldExample { 
final int x; 
int y; 
static FinalFieldExample f; 
public FinalFieldExample() { 
3 
y=4; 
} 
static void writer() { 


f = new FinalFieldExample(); 
上 


static void reader() { 
if (f != null) { 
int 1 = fx 
int j = f.y; 
} 
} 
} 
上 面 的 类 中 展示 了 怎么 使 用 final 域 。 能 够 确保 另 一 调用 reader 的 线程 它 能 看 到 fx 的 
值 是 因为 fx 是 final 的 ， 但 不 能 保证 它 能 看 到 fy 的 值 是 4， 因 为 它 不 是 final 的 。 如 果 
FinalFieldExample 的 构造 器 像 这 样 : 


public FinalFieldExample() { // bad! 
= 37 
// bad construction - allowing this to escape 
global.obj = this;// 暴露 this 
} 
这 样 其 他 线程 通过 global.obj 读 x 的 值 将 不 能 确保 是 3。 上 面 列举 的 例子 是 final 类 型 
的 基本 类 型 变量 ， 如 果 final 修饰 的 是 一 个 引用 类 型 ， 则 也 会 有 这 样 的 保障 ， 在 拿 到 final 


引用 类 型 前 这 个 引用 所 指向 的 对 象 的 所 有 域 将 完全 初始 化 构造 完成 。 


16.3.5 long 和 double 型 变量 


Java 内 存 模型 要 求 lock、unlock、read、load、assign、use、store 和 write 这 8 个 操作 
都 具有 原子 性 ， 但 是 对 于 64 位 的 数据 类 型 (long 和 double)， 在 模型 中 特别 定义 了 一 条 宽松 
的 规定 : 允许 虚拟 机 将 没有 被 volatile 修饰 的 64 位 数据 的 读 写 操作 划分 为 两 次 32 位 的 操 
作 来 进行 ， 即 允许 虚拟 机 实现 选择 可 以 不 保证 64 位 数据 类 型 的 load、store、read 和 write 
这 四 个 操作 的 原子 性 ， 这 点 就 是 所 谓 的 long 和 double 的 非 原 子 性 协定 (Nonatomic 
Treatment of double and long Variables)。 如 果 有 多 个 线程 共享 一 个 并 未 声明 为 volatile 的 
long 或 double 类 型 的 变量 ， 并 且 同 时 对 它们 进行 读 取 和 修改 操作 ， 那 么 某 些 线程 可 能 会 读 
取 到 一 个 既 非 原 值 ， 也 不 是 其 他 线程 修改 值 的 代表 了 “ 半 个 变量 ”的 数值 。 
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不 过 这 种 读 取 到 “ 半 个 变量 ”的 情况 非常 罕见， 因为 Java 内 存 模型 虽然 允许 虚拟 机 不 
把 long 和 double 变量 的 读 写实 现成 原子 操作 ， 但 允许 虚拟 机 选择 把 这 些 操作 实现 为 具有 
原子 性 的 操作 ， 而 且 还 “强烈 建议 ”虚拟 机 这 样 实现 。 在 实际 开发 中 ， 目 前 各 种 平台 下 的 
商用 虚拟 机 几乎 都 选择 把 64 位 数据 的 读 写 操作 作为 原子 操作 来 对 待 ， 因 此 我 们 在 编写 代 
码 时 一 般 不 需要 将 用 到 的 long 和 double 变量 专门 声明 为 volatile。 


16.3.6 原子 性 、 可 见 性 与 有 序 性 


介绍 完 Java 内 存 模 型 的 相关 操作 和 规则 ， 我 们 再 整体 回顾 一 下 这 个 模型 的 特征 。Java 
内 存 模型 是 围绕 着 在 并 发 过 程 中 如 何 处 理 原 子 性 、 可 见 性 和 有 序 性 这 三 个 特征 来 建立 的 ， 
我 们 逐个 来 看 一 下 哪些 操作 实现 了 这 三 个 特性 。 

1) 原子 性 ( Atomicity) 

由 Java 内 存 模型 来 直接 保证 的 原子 性 变量 操作 包括 read、load、assign、use、store 和 
write 这 六 个 ， 我 们 大 致 可 以 认为 基本 数据 类 型 的 访问 读 写 是 具备 原子 性 的 (10ng 和 double 
的 非 原 子 性 协定 例外 ， 笔 者 的 观点 是 知道 这 件 事情 就 可 以 了 ， 无 须 太 过 在 意 这 些 几 乎 不 会 
发 生 的 例外 情况 )。 

如 果 应 用 场景 需要 一 个 更 大 范围 的 原子 性 保证 (经 常会 遇 到 )，Java 内 存 模型 还 提供 了 
lock 和 unlock 操作 来 满足 这 种 需求 ， 尽 管 虚拟 机 未 把 lock 和 unlock 操作 直接 开放 给 用 户 
使 用 ， 但 是 却 提 供 了 更 高 层次 的 字 节 码 指令 monitorenter 和 monitorexit 来 隐 式 地 使 用 这 两 
个 操作 ， 这 两 个 字 节 码 指令 反映 到 Java 代码 中 就 是 同步 块 -synchronized 关键 字 ， 因 此 在 
synchronized 块 之 间 的 操作 也 具备 原子 性 。 

2) 可 见 性 (Visibility) 

可 见 性 就 是 指 当 一 个 线程 修改 了 共享 变量 的 值 ， 其 他 线程 能 够 立即 得 知 这 个 修改 。 上 
文 在 讲解 volatile 变量 的 时 候 我 们 已 详细 讨论 过 这 一 点 。Java 内 存 模型 是 通过 在 变量 修改 
后 将 新 值 同 步 回 主 内 存 ， 在 变量 读 取 前 从 主 内 存 刷 新 变量 值 这 种 依赖 主 内 存 作 为 传递 媒介 
的 方式 来 实现 可 见 性 的 ， 无 论 是 普通 变量 还 是 volatile 变量 都 是 如 此 ， 普 通 变 量 与 volatile 
变量 的 区 别 是 volatile 的 特殊 规则 保证 了 新 值 能 立即 同步 到 主 内 存 ， 以 及 每 次 使 用 前 立即 
从 主 内 存 刷新 。 因 此 我 们 可 以 说 volatile 保证 了 多 线程 操作 时 变量 的 可 见 性 ， 而 普通 变量 
则 不 能 保证 这 一 点 。 

除了 volatile 之 外 ，Java 还 有 两 个 关键 字 能 实现 可 见 性 ， 它 们 是 synchronized 和 
final。 同 步 块 的 可 见 性 是 由 “对 一 个 变量 执行 unlock 操作 之 前 ， 必 须 先 把 此 变量 同步 回 主 
内 存 中 (执行 store 和 write 操作 )” 这 条 规则 获得 的 ， 而 final 关键 字 的 可 见 性 是 指 : 被 final 
修饰 的 字段 在 构造 器 中 一 旦 被 初始 化 完成 ， 并 且 构 造 器 没有 把 “this” 的 引用 传递 出 去 (this 
引用 逃逸 是 一 件 很 危险 的 事情 ， 其 他 线程 有 可 能 通过 这 个 引用 访问 到 “初始 化 了 一 半 ” 的 
对 象 )， 那 么 在 其 他 线程 中 就 能 看 见 final 字段 的 值 。 

3) 有 序 性 (Ordering) 

Java 内 存 模型 的 有 序 性 在 前 面 讲解 volatile 时 也 详细 地 讨论 过 了 ，Java 程序 中 天 然 的 
有 序 性 可 以 总 结 为 一 句 话 : 如 果 在 本 线程 内 观察 ， 所 有 的 操作 都 是 有 序 的 ， 如 果 在 一 个 线 
程 中 观察 另 一 个 线程 ， 所 有 的 操作 都 是 无 序 的 。 前 半 句 是 指 “ 线 程 内 表现 为 串 行 的 语义 ” 


CE 


第 16 章 内 存 模型 和 线程 台 


(Within-Thread As-If-Serial Semantics)， 后 半 句 是 指 “ 指 令 重 排序 ”现象 和 “工作 内 存 与 主 
内 存 同步 延迟 ”现象 。 

Java 语言 提供 了 volatile 和 synchronized 两 个 关键 字 来 保证 线程 之 间 操作 的 有 序 性 ， 
volatile 关键 字 本 身 就 包含 了 禁止 指令 重 排序 的 语义 ， 而 synchronized 则 是 由 “一 个 变量 在 
同一 个 时 刻 只 允许 一 条 线程 对 其 进行 lock 操作 ”这 条 规则 获得 的 ， 这 个 规则 决定 了 持 有 同 
一 个 锁 的 两 个 同步 块 只 能 串 行 地 进入 。 

介绍 完 并 发 的 三 种 重要 特性 ， 读 者 有 没有 发 现 synchronized 关键 字 在 需要 这 三 种 特性 
的 时 候 都 可 以 作为 其 中 一 种 的 解决 方案 ? 看 起 来 很 “万 能 ” 吧 ? 的 确 ， 大 部 分 的 并 发 控制 
操作 都 能 使 用 synchronized 来 完成 。synchronized 的 “万 能 ”也 间接 造就 了 它 被 程序 员 滥 用 
的 局 面 ， 越 “万 能 ”的 并 发 控制 ， 通 常会 伴随 着 越 大 的 性 能 影响 


16.3.7 ”先行 发 生 原则 


如 果 Java 内 存 模型 中 所 有 的 有 序 性 都 只 靠 volatile 和 synchronized 来 完成 ， 那 么 有 一 
些 操 作 将 会 变 得 很 虽 唆 ， 但 是 我 们 在 编写 Java 并 发 代码 的 时 候 并 没有 感觉 到 这 一 点 ， 这 是 
因为 Java 语言 中 有 一 个 “先行 发 生 ”(Happens-before) 的 原则 。 这 个 原则 非常 重要 ， 它 是 判 
断 数据 是 否 存在 竞争 ， 线 程 是 否 安全 的 主要 依据 ， 依 赖 这 个 原则 ， 我 们 可 以 通过 几 条 规则 
一 揽 子 解决 并 发 环境 下 两 个 操作 之 间 是 否 可 能 存在 冲突 的 所 有 问题 。 

现在 就 来 看 看 “先行 发 生 ” 原 则 指 的 是 什么 。 先 行 发 生 是 Java 内 存 模型 中 定义 的 两 项 
操作 之 间 的 偏 序 关系 ， 如 果 说 操作 A 先行 发 生 于 操作 B， 其 实 就 是 说 在 发 生 操 作 B 之 前 ， 
操作 A 产生 的 影响 能 被 操作 B 观察 到 ，“ 影 响 ” 包 括 修改 了 内 存 中 共享 变量 的 值 、 发 送 了 
消息 、 调 用 了 方法 等 。 这 句 话 不 难 理解 ， 但 它 意味 着 什么 呢 ? 我 们 可 以 举 个 例子 来 说 明 一 
下 ， 例 如 下 面 列 出 了 这 三 句 伪 代 码 ， 演 示 了 先行 发 生 原则 的 过 程 。 

// 以 下 操作 在 线程 A 中 执行 


i=1; 


{ 
// 以 下 操作 在 线程 中 执行 
/7 以 下 操作 在 线程 < 中 执行 。 ? 
i= 2; 
假设 线程 A 中 的 操作 “i-1” 先 行 发 生 于 线程 B 的 操作 “j=1” 那 我 们 就 可 以 确定 在 线 
程 B 的 操作 执行 后 ， 变 量 j 的 值 一 定 是 等 于 1， 得 出 这 个 结论 的 依据 有 两 个 ， 一 是 根据 先 
行 发 生 原则 ，“i-1” 的 结果 可 以 被 观察 到 ; 二 是 线程 C 登场 之 前 ， 线 程 A 操作 结束 之 后 
没有 其 他 线程 会 修改 变量 i 的 值 。 现 在 再 来 考虑 线程 C， 我 们 依然 保持 线程 A 和 B 之 间 的 
先行 发 生 关系 ， 而 C 出 现在 线程 A 和 B 的 操作 之 间 ， 但 是 C 与 B 没 有 先行 发 生 关系 ， 那 j 
的 值 会 是 多 少 呢 ?答案 是 不 确定 1、1 和 2 都 有 可 能 ， 因 为 线程 C 对 变量 i 的 影响 可 能 会 
被 线程 B 观察 到 ， 也 可 能 不 会 ， 这 时 候 线 程 B 就 存在 读 取 到 过 期 数据 的 风险 ， 不 具备 多 线 
程 安全 性 。 
下 面 是 Java 内 存 模型 下 一 些 “ 天 然 的 ”先行 发 生 关 系 ， 这 些 先行 发 生 关 系 无 须 任何 同 
步 器 协助 就 已 经 存在 ， 可 以 在 编码 中 直接 使 用 。 如 果 两 个 操作 之 间 的 关系 不 在 此 列 ， 并 且 
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无 法 从 下 列 规 则 推导 出 来 的 话 ， 它 们 就 没有 顺序 性 保障 ， 虚 拟 机 可 以 对 它们 进行 随意 地 重 
排序 。 
口 ”程序 次 序 规则 (Program Order Rule): 在 一 个 线程 内 ， 按 照 程 序 代码 顺序 ， 书 写 在 
前 面 的 操作 先行 发 生 于 书写 在 后 面 的 操作 。 准 确 地 说 应 该 是 控制 流 顺 序 而 不 是 程 
序 代码 顺序 ， 因 为 要 考虑 分 支 、 循 环 等 结构 。 
口 “ 管 程 锁 定 规则 (Monitor Lock Rule): 一 个 unlock 操作 先行 发 生 于 后 面 对 同 一 个 锁 
的 lock 操作 。 这 里 必须 强调 的 是 同一 个 锁 ， 而 “后 面 ” 是 指 时 间 上 的 先后 顺序 。 
口 ”volatile 变量 规则 (Volatile Variable Rule): 对 一 个 volatile 变量 的 写 操作 先行 发 生 
于 后 面 对 这 个 变量 的 读 操 作 ， 这 里 的 “后 面 ”同样 是 指 时 间 上 的 先后 顺序 。 
口 ”线程 启动 规则 (Thread Start Rule): Thread 对 象 的 start() 方 法 先行 发 生 于 此 线程 的 
每 一 个 动作 。 
口 “线程 终止 规则 (Thread Termination Rule): 线程 中 的 所 有 操作 都 先行 发 生 于 对 此 线 
程 的 终止 检测 ， 我 们 可 以 通过 Thr<:adjoin0 方 法 结束 、Thread.isAlive0 的 返回 值 
等 手段 检测 到 线程 已 经 终止 执行 。 
口 “” 线 程 中 断 规则 (Thread Interruption Rule): 对 线程 nterrupt() 方 法 的 调用 先行 发 生 于 
被 中 断 线 程 的 代码 检测 到 中 断 事件 的 发 生 ， 可 以 通过 Thread.interrupted() 方 法 检测 
到 是 否 有 中 断 发 生 。 
口 “ 对 象 终结 规则 (Finalizer Rule): 一 个 对 象 的 初始 化 完成 (构造 函数 执行 结束 ) 先 行 发 
生 于 它 的 fmnalize() 方 法 的 开始 。 
口 ”传递 性 (Transitivity): 如 果 操 作 A 先行 发 生 于 操作 B， 操 作 B 先行 发 生 于 操作 
C， 那 就 可 以 得 出 操作 A 先行 发 生 于 操作 C 的 结论 。 
Java 语言 无 须 任何 同步 手段 保障 就 能 成 立 的 先行 发 生 规则 就 只 有 上 面 这 些 了 ， 笔 者 演 
示 一 下 如 何 使 用 这 些 规则 去 判定 操作 间 是 否 具备 顺序 性 ， 对 于 读 写 共享 变量 的 操作 来 说 ， 
就 是 线程 是 否 安 全 ， 读 者 还 可 以 从 下 面 这 个 例子 中 感受 一 下 “时 间 上 的 先后 顺序 ”与 “ 先 
行 发 生 ” 之 间 有 什么 不 同 。 
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16.4 线 程 


并 发 不 一 定 要 依赖 多 线程 (如 PHP 中 很 常见 的 多 进程 并 发 )， 但 是 在 Java 里 面谈 论 并 
发 ， 大 多 数 都 与 线程 脱 不 开关 系 。 既 然 我 们 这 本 书 探讨 的 话题 是 Java 虚拟 机 的 特性 ， 那 讲 
到 Java 线程 ， 我 们 就 从 Java 线程 在 虚拟 机 中 的 实现 开始 讲 起 。 


16.4.1 线程 的 实现 


我 们 知道 ， 线 程 是 比 进程 更 轻 量 级 的 调度 执行 单位 ， 线 程 的 引入 ， 可 以 把 一 个 进程 的 
资源 分 配 和 执行 调度 分 开 ， 各 个 线程 既 可 以 共享 进程 资源 (内 存 地 址 、 文 件 IO 等 )， 又 可 
以 独立 调度 (线程 是 CPU 调度 的 最 基本 单位 )。 主 流 的 操作 系统 都 提供 了 线程 实现 ，Java 语 
言 则 提供 了 在 不 同 硬件 和 操作 系统 平台 下 对 线程 操作 的 统一 处 理 ， 每 个 java.lang.Thread 类 
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的 实例 就 代表 了 一 个 线程 。 不 过 Thread 类 与 大 部 分 的 Java API 有 着 显著 的 差别 ， 它 的 所 
有 关键 方法 都 被 声明 为 Native。 

在 Java API 中 一 个 Native 方法 可 能 就 意味 着 这 个 方法 没有 使 用 或 无 法 使 用 平台 无 关 的 
手段 来 实现 (当然 也 可 能 是 为 了 执行 效率 而 使 用 Native 方法 ， 不 过 通常 最 高 效率 的 手段 也 
就 是 平台 相关 的 手段 )。 正 因为 这 个 原因 ， 作 者 把 本 节 的 标题 定 为 “线程 的 实现 ”而 不 是 
“Java 线程 的 实现 ”。 

实现 线程 主要 有 三 种 方式 具体 说 明 如 下 。 


1. 使 用 内 核 线程 实现 


内 核 线程 (Kernel Thread，KLT) 就 是 直接 由 操作 系统 内 核 (Kermnel， 下 称 内 核 ) 支 持 的 线 
程 ， 这 种 线程 由 内 核 来 完成 线程 切换 ， 内 核 通 过 操纵 调度 器 (Scheduler) 对 线程 进行 调度 ， 
并 负责 将 线程 的 任务 映射 到 各 个 处 理 器 上 。 每 个 内 核 线 程 都 可 以 看 做 是 内 核 的 一 个 分 身 ， 
这 样 操作 系统 就 有 能 力 同 时 处 理 多 件 事情 ， 支 持 多 线程 的 内 核 就 叫 多 线程 内 核 (Multi- 
Threads Kernel)。 

程序 一 般 不 会 直接 去 使 用 内 核 线程 ， 而 是 去 使 用 内 核 线程 的 一 种 高 级 接口 一 一 轻 量 级 
进程 (Light Weight Process，LWP)， 轻 量 级 进程 就 是 我 们 通常 意义 上 所 讲 的 线程 ， 由 于 每 
个 轻 量 级 进程 都 由 一 个 内 核 线程 支持 ， 因 此 只 有 先 支持 内 核 线程 ， 才 能 有 轻 量 级 进程 。 这 
种 轻 量 级 进程 与 内 核 线程 之 间 1 : 1 的 关系 称 为 一 对 一 的 线程 模型 。 由 于 内 核 线程 的 支 
持 ， 每 个 轻 量 级 进程 都 成 为 一 个 独立 的 调度 单元 ， 即 使 有 一 个 轻 量 级 进程 在 系统 调用 中 阻 
塞 了 ， 也 不 会 影响 整个 进程 继续 工作 ， 但 是 轻 量 级 进程 具有 它 的 局 限 性 : 首先 ， 由 于 是 基 
于 内 核 线程 实现 的 ， 所 以 各 种 线程 操作 ， 如 创建 、 析 构 及 同步 ， 都 需要 进行 系统 调用 。 而 
系统 调用 的 代价 相对 较 高 ， 需 要 在 用 户 态 (User Mode) 和 内 核 态 (Kemel Mode) 中 来 回 切 换 。 
其 次 ， 每 个 轻 量 级 进程 都 需要 有 一 个 内 核 线程 的 支持 ， 因 此 轻 量 级 进程 要 消耗 一 定 的 内 核 
资源 (如 内 核 线程 的 栈 空间 )， 因 此 一 个 系统 支持 轻 量 级 进程 的 数量 是 有 限 的 。 


2. 使 用 用 户 线程 实现 


广义 上 来 讲 ， 一 个 线程 只 要 不 是 内 核 线 程 ， 那 就 可 以 认为 是 用 户 线程 (User Thread， 
UT)， 因 此 从 这 个 定义 上 来 讲 轻 量 级 进程 也 属于 用 户 线程 ， 但 轻 量 级 进程 的 实现 始终 是 建 
立 在 内 核 之 上 的 ， 许 多 操作 都 要 进行 系统 调用 ， 因 此 效率 会 受到 限制 。 

而 狭义 上 的 用 户 线程 指 的 是 完全 建立 在 用 户 空间 的 线程 库 上 ， 系 统 内 核 不 能 感知 到 线 
程 存在 的 实现 。 用 户 线程 的 建立 、 同 步 、 销 毁 和 调度 完全 在 用 户 态 中 完成 ， 不 需要 内 核 的 
帮助 。 如 果 程 序 实现 得 当 ， 这 种 线程 不 需要 切换 到 内 核 态 ， 因 此 操作 可 以 是 非常 快速 且 低 
消耗 的 ， 也 可 以 支持 规模 更 大 的 线程 数量 ， 部 分 高 性 能 数据 库 中 的 多 线程 就 是 由 用 户 线程 
实现 的 。 这 种 进程 与 用 户 线程 之 间 1 : N 的 关系 称 为 一 对 多 的 线程 模型 。 

使 用 用 户 线程 的 优势 在 于 不 需要 系统 内 核 支 援 ， 劣 势 也 在 于 没有 系统 内 核 的 支援 ， 所 
有 的 线程 操作 都 需要 用 户 程序 自己 处 理 。 线 程 的 创建 、 切 换 和 调度 都 是 需要 考虑 问题 ， 而 
且 由 于 操作 系统 只 把 处 理 器 资源 分 配 到 进程 ， 那 诸如 “阻塞 如 何 处 理 ”、“ 多 处 理 器 系统 
中 如 何 将 线程 映射 到 其 他 处 理 器 上 ”这 类 问题 解决 起 来 将 会 异常 困难 ， 甚 至 不 可 能 完成 。 
因而 使 用 用 户 线程 实现 的 程序 一 般 都 比较 复杂 ， 除 了 以 前 在 不 支持 多 线程 的 操作 系统 中 (如 
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DOS) 的 多 线程 程序 与 少数 有 特殊 需求 的 程序 外 ， 现 在 使 用 用 户 线程 的 程序 越 来 越 少 了 ， 
Java、Ruby 等 语言 都 曾经 使 用 过 用 户 线程 ， 最 终 又 都 放弃 了 使 用 它 。 

3. 混合 实现 

线程 除了 依赖 内 核 线程 实现 和 完全 由 用 户 程序 自己 实现 之 外 ， 还 有 一 种 将 内 核 线程 与 
用 户 线程 一 起 使 用 的 实现 方式 。 在 这 种 混合 实现 下 ， 既 存在 用 户 线程 ， 也 存在 轻 量 级 进 
程 。 用 户 线程 还 是 完全 建立 在 用 户 空间 中 ， 因 此 用 户 线程 的 创建 、 切 换 、 析 构 等 操作 依然 
廉价 ， 并 且 可 以 支持 大 规模 的 用 户 线程 并 发 。 而 操作 系统 提供 支持 的 轻 量 级 进程 则 作为 用 
户 线程 和 内 核 线程 之 间 的 桥梁 ， 这 样 可 以 使 用 内 核 提供 的 线程 调度 功能 及 处 理 器 映射 ， 并 
且 用 户 线程 的 系统 调用 要 通过 轻 量 级 线程 来 完成 ， 大 大 降低 了 进程 被 阻塞 的 风险 。 在 这 种 
混合 模式 中 ， 用 户 线程 与 轻 量 级 进程 的 数量 比 是 不 定 的 ， 是 M : N 的 关系 ， 这 种 就 是 多 对 
多 的 线程 模型 。 许 多 Unix 系列 的 操作 系统 ， 如 Solaris、HP-UX 等 都 提供 了 M : N 的 线程 
模型 实现 。 


4. Java 线程 的 实现 


Java 线程 在 JDK 12 之 前 ， 是 基于 名 为 “绿色 线程 ”(Green Threads) 的 用 户 线程 实现 
的 ， 而 在 JDK 12 中 ， 线 程 模型 被 蔡 换 为 基于 操作 系统 原生 线程 模型 来 实现 。 因 此 在 目前 
的 JDK 版 本 中 ， 操 作 系统 支持 怎样 的 线程 模型 ， 在 很 大 程度 上 就 决定 了 Java 虚拟 机 的 线 
程 是 怎样 映射 的 ， 这 点 在 不 同 的 平台 上 没有 办 法 达成 一 致 ， 虚 拟 机 规范 中 也 并 未 限定 Java 
线程 需要 使 用 哪 种 线程 模型 来 实现 。 线 程 模型 只 对 线程 的 并 发 规模 和 操作 成 本 产生 影响 ， 
对 Java 程序 的 编码 和 运行 过 程 来 说 ， 这 些 差异 都 是 透明 的 。 

对 于 Sun JDK 来 说 ， 它 的 Windows 版 与 Linux 版 都 是 使 用 一 对 一 的 线程 模型 来 实现 

一 条 Java 线程 就 映射 到 一 条 轻 量 级 进程 之 中 ， 因 为 Windows 和 Linux 系统 提供 的 线 
程 模型 就 是 一 对 一 的 。 

而 在 Solaris 平台 中 ， 由 于 操作 系统 的 线程 特性 可 以 同时 支持 一 对 一 (通过 Bound 
Threads 或 Alternate Libthread 实现 ) 及 多 对 多 (通过 LWP/Thread Based Synchronization 实现 ) 
的 线程 模型 ， 因 此 在 Solaris 版 的 JDK 中 也 对 应 提供 了 两 个 平台 专 有 的 虚拟 机 参数 : 
-XX:+UseLWPSynchronization( 默 认 值 ) 和 -XX:+UseBoundThreads 来 明确 指定 虚拟 机 使 用 的 
是 哪 种 线程 模型 。 


16.4.2 ”线程 调度 


计算 机 通常 只 有 一 个 CPU， 在 任意 时 刻 只 能 执行 一 条 机 器 指令 ， 每 个 线程 只 有 获得 
CPU 的 使 用 权 才 能 执行 指令 。 

所 谓 多 线程 的 并 发 运行 ， 其 实 是 指 各 个 线程 轮流 获得 CPU 的 使 用 权 ， 分 别 执行 各 自 
的 任务 。 在 可 运行 池 中 ， 会 有 多 个 处 于 就 绪 状 态 的 线程 在 等 待 CPU。 

Java 虚拟 机 的 一 项 任务 就 是 负责 线程 的 调度 。 线 程 的 调度 是 指 按照 特定 的 机 制 为 多 个 
线程 分 配 CPU 的 使 用 权 ， 有 两 种 调度 模型 : 分 时 调度 模型 和 抢占 式 调 度 模 型 。 

分 时 调度 模型 是 指 让 所 有 线程 轮流 获得 CPU 的 使 用 权 ， 并 且 平 均 分 配 每 个 线程 占用 
CPU 的 时 间 片 。Java 虚拟 机 采用 抢占 式 调度 模型 ， 它 是 指 优先 让 可 运行 池 中 优先 级 高 的 线 
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程 占用 CPU， 如 果 可 运行 池 中 线程 的 优先 级 相同 ， 那 么 就 随机 地 选择 一 个 线程 ， 使 其 占用 
CPU。 处 于 运行 状态 的 线程 会 一 直 运 行 ， 直 至 它 不 得 不 放弃 CPU。 一 个 线程 会 因为 以 下 原 
因而 放弃 CPU: 

口 Java 虚拟 机 让 当前 线程 暂时 放弃 CPU， 转 到 就 绪 状 态 ， 使 其 他 线程 获得 运行 

机 会 。 

口 “ 当 前 线程 因为 某 些 原因 而 进入 阻塞 状态 。 

口 ”线程 运行 结束 。 

值得 注意 的 是 ， 线 程 的 调度 不 是 跨 平 台 的 ， 它 不 仅 取 决 于 Java 虚拟 机 ， 还 依赖 于 操作 
系统 。 在 某 些 操作 系统 中 ， 只 要 运行 中 的 线程 没有 遇 到 阻塞 ， 就 不 会 放弃 CPU; 在 某 些 操 
作 系 统 中 ， 即 使 运行 中 的 线程 没有 遇 到 阻塞 ， 也 会 在 运行 一 段 时 间 后 放弃 CPU， 给 其 他 线 
程 运行 的 机 会 。 

由 于 Java 线程 的 调度 不 是 分 时 的 ， 因 此 同时 启动 多 个 线程 后 ， 不 能 保证 各 个 线程 轮流 
获得 均等 的 CPU 时 间 片 。 如 果 程 序 希 望 干预 Java 虚拟 机 对 线程 的 调度 过 程 ， 从 而 明确 地 
让 一 个 线程 给 另外 一 个 线程 运行 的 机 会 ， 可 以 采取 以 下 办 法 之 一 : 

(1) 调整 各 个 线程 的 优先 级 。 

(2) 让 处 于 运行 状态 的 线程 调用 Thread.sleep() 方 法 。 

(3) 让 处 于 运行 状态 的 线程 调用 Thread yield() 方 法 。 

(4) 让 处 于 运行 状态 的 线程 调用 另 一 个 线程 的 join0 方 法 。 


16.4.3 ”线程 状态 间 的 转换 


线程 的 状态 转换 是 线程 控制 的 基础 。 线 程 状态 总 的 可 分 为 五 大 状态 ， 分 别 是 生 、 死 、 
可 运行 、 运 行 、 等 待 /阻塞 。 具 体 过 程 如 图 16-2 所 示 。 


等 待 


/阻塞 /睡眠 


图 16-2 ”线程 的 状态 转换 


(1) 新 状态 : 线程 对 象 已 经 创建 ， 还 没有 在 其 上 调用 start() 方 法 。 

(2) 可 运行 状态 : 当 线 程 有 资格 运行 ， 但 调度 程序 还 没有 把 它 选 定 为 运行 线程 时 线程 
所 处 的 状态 。 当 start( 方 法 调用 时 ， 线 程 首先 进入 可 运行 状态 。 在 线程 运行 之 后 或 者 从 阻 
塞 、 等 待 或 睡眠 状态 回来 后 ， 也 返回 到 可 运行 状态 。 

(3) 运行 状态 : 线程 调度 程序 从 可 运行 池 中 选择 一 个 线程 作为 当前 线程 时 线程 所 处 的 
状态 。 这 也 是 线程 进入 运行 状态 的 唯一 一 种 方式 。 

(4) 等 待 /阻塞 /睡眠 状态 : 这 是 线程 有 资格 运行 时 它 所 处 的 状态 。 实 际 上 这 个 三 状态 组 
合 为 一 种 ， 其 共同 点 是 : 线程 仍旧 是 活 的 ， 但 是 当前 没有 条 件 运 行 。 换 句 话说 ， 它 是 可 运 
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行 的 ， 但 是 如 果 某 件 事件 出 现 ， 他 可 能 返回 到 可 运行 状态 。 
(5) 死亡 态 : 当 线程 的 mn0 方 法 完成 时 就 认为 它 死去 。 这 个 线程 对 象 也 许 是 活 的 ， 但 
是 ， 它 已 经 不 是 一 个 单独 执行 的 线程 。 线 程 一 旦 死亡 ， 就 不 能 复生 。 如 果 在 一 个 死去 的 
线程 上 调用 start0 方 法 ， 会 抛 出 javalang.IllegalThreadStateException 异常 。 
对 于 线程 阻止 需要 考虑 以 下 三 个 方面 ， 不 考虑 IO 阻塞 的 情况 : 
口 ”睡眠 ; 
口 ”等 待 ; 
口 ” 因 为 需要 一 个 对 象 的 锁定 而 被 阻塞 。 
1) 睡眠 
Thread.sleep(long millis) 和 Thread.sleep(long millis, int nanos) 静 态 方 法 强制 当前 正在 执 
行 的 线程 休眠 (暂停 执行 )， 以 “ 减 慢 线程 ”。 当 线程 睡眠 时 ， 它 入 睡 在 某 个 地 方 ， 在 苏醒 
之 前 不 会 返回 到 可 运行 状态 。 当 睡眠 时 间 到 期 ， 则 返回 到 可 运行 状态 。 
(1) 线程 睡眠 的 原因 
线程 执行 太 快 ， 或 者 需要 强制 进入 下 一 轮 ， 因 为 Java 规范 不 保证 合理 的 轮换 。 例 如 下 
面 是 睡眠 的 实现 的 代码 ， 在 此 调用 了 静态 方法 。 
try { 
Thread.sleep (123); 
} catch (InterruptedException e) { 
e.printstackTrace (); 
} 
(2) 睡眠 的 位 置 
为 了 让 其 他 线程 有 机 会 执行 ， 可 以 将 Thread.sleep0 的 调用 放 线 程 ran0) 之 内 。 这 样 才能 
保证 该 线程 执行 过 程 中 会 睡眠 。 例 如 ， 在 前 面 的 例子 中 ， 将 一 个 耗 时 的 操作 改 为 睡眠 ， 以 
减 慢 线程 的 执行 。 可 以 这 么 写 : 
public void run() { 
for(int i = 0;i<5;i++){ 
// 很 耗 时 的 操作 ， 用 来 减 慢 线程 的 执行 
for (long k= 0; k <100000000; k++); 
try { 
Thread.sleep (3); 
} catch (InterruptedException e) { 
e.printstackTrace(); . 


3 
System.out .println (this.getName ()+" :"+i); 


第 16 章 内 存 模型 和 线程 台 


ll 
A 


李 四 :4 和 . 

Process finished with exit code 0 

这 样 ， 线 程 在 每 次 执行 过 程 中 ， 总 会 睡眠 3 毫秒 ， 睡 眠 了 ， 其 他 的 线程 就 有 机 会 执 

行 了 。 

注意 : 

口 ”线程 睡眠 是 帮助 所 有 线程 获得 运行 机 会 的 最 好 方法 。 

口 ”线程 睡 眠 到 期 自动 苏醒 ， 并 返回 到 可 运行 状态 ， 不 是 运行 状态 。sleep() 中 指定 的 
时 间 是 线程 不 会 运行 的 最 短 时 间 。 因 此 ，sleep0 方 法 不 能 保证 该 线程 睡眠 到 期 后 


就 开始 执行 。 
口 sleep0 是 静态 方法 ， 只 能 控制 当前 正在 运行 的 线程 。 
下 面 给 个 例子 : 


/太太 


* 一 个 计数 器 ， 计 数 到 100， 在 每 个 数字 之 间 暂 停 1 秒 ， 每 隔 10 个 数字 输出 一 个 字符 串 


* Qauthor leizhimin 2008-9-14 9:53:49 
区 
public class MyThread extends Thread { 


public void run() { 
For (nt i= 0 < L007 Lr 
if ((i) $ 10 == 0) { 
System.out .println("-————-—— i 
} 
System.out.print (i); 
Ey 
Thread.sleep (1); 
System.out .print(" 线程 睡眠 1 毫秒 ! \n"); 
} catch (InterruptedException e) { 
e.printstackTrace (); 
} 


} 


public static void main(string[] args) { 
new MyThread() .start (); 


0 线程 睡眠 1 毫秒 ! 
1 ”线程 睡眠 1 毫秒 ! 
2 ”线程 睡眠 1 毫秒 ! 
3 ”线程 睡眠 1 毫秒 ! 
4 ”线程 睡眠 1 毫秒 ! 
5 ”线程 睡眠 1 毫秒 ! 
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6 线程 睡眠 1 毫秒 ! 
7 线程 睡眠 1 毫秒 ! 
8 线程 睡眠 1 毫秒 ! 
9 ”线程 睡眠 1 毫秒 ! 


90 ”线程 睡眠 1 毫秒 ! 
91 ”线程 睡眠 1 毫秒 ! 
92 ”线程 睡眠 1 毫秒 ! 
93 ”线程 睡眠 1 毫秒 ! 
94 ”线程 睡眠 1 毫秒 ! 
95 ”线程 睡眠 1 毫秒 ! 
96 ”线程 睡眠 1 毫秒 ! 
97 ”线程 睡眠 1 毫秒 ! 
98 ”线程 睡眠 1 毫秒 ! 
99 ”线程 睡眠 1 毫秒 ! 


Process finished with exit code 0 


2) 线程 的 优先 级 和 线程 让 步 yield() 

线程 的 让 步 是 通过 Thread.yield(0) 来 实现 的 。yield() 方 法 的 作用 是 : 暂停 当前 正在 执行 
的 线程 对 象 ， 并 执行 其 他 线程 。 要 理解 yield0， 必 须 了 解 线程 的 优先 级 的 概念 。 线 程 总 是 
存在 优先 级 ， 优 先 级 范围 在 1~10 之 间 。JVM 线程 调度 程序 是 基于 优先 级 的 抢先 调度 机 
制 。 在 大 多 数 情 况 下 ， 当 前 运行 的 线程 优先 级 将 大 于 或 等 于 线程 池 中 任何 线程 的 优先 级 。 
但 这 仅仅 是 大 多 数 情况 。 

当 设 计 多 线程 应 用 程序 的 时 候 ， 一 定 不 要 依赖 于 线程 的 优先 级 。 因 为 线程 调度 优先 级 
操作 是 没有 保障 的 ， 只 能 把 线程 优先 级 作用 作为 一 种 提高 程序 效率 的 方法 ， 但 是 要 保证 程 
序 不 依赖 这 种 操作 。 

当 线 程 池 中 线程 都 具有 相同 的 优先 级 ， 调 度 程序 的 JVM 实现 自由 选择 它 喜 欢 的 线 
程 。 这 时 候 调度 程序 的 操作 有 两 种 可 能 : 一 是 选择 一 个 线程 运行 ， 直 到 它 阻 塞 或 者 运行 完 
成 为 止 。 二 是 时 间 分 片 ， 为 池内 的 每 个 线程 提供 均等 的 运行 机 会 。 

设置 线程 的 优先 级 : 线程 默认 的 优先 级 是 创建 它 的 执行 线程 的 优先 级 。 可 以 通过 
setPriority(int newPriority) 更 改线 程 的 优先 级 。 例 如 : 

Thread 七 = new MYThread() 
七 .SetPriority(8) 
上 -Start () 7 

线程 优先 级 为 1~10 之 间 的 正 整数 ，JVM 从 不 会 改变 一 个 线程 的 优先 级 。 然 而 ，1~10 
之 间 的 值 是 没有 保证 的 。 一 些 JVM 可 能 不 能 识别 10 个 不 同 的 值 ， 而 将 这 些 优先 级 进行 每 
两 个 或 多 个 合并 ， 变 成 少 于 10 个 的 优先 级 ， 则 两 个 或 多 个 优先 级 的 线程 可 能 被 映射 为 一 
个 优先 级 。 

线程 默认 优先 级 是 5，Thread 类 中 有 三 个 常量 ， 定 义 线程 优先 级 范围 

口 static int MAX_PRIORITY: 线程 可 以 具有 的 最 高 优先 级 。 

口 static int MIN PRIORITY: 线程 可 以 具有 的 最 低 优先 级 。 

口 static int NORM_PRIORITY: 分 配给 线程 的 默认 优先 级 。 
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3) Thread.yield() 方 法 

Thread.yield( 方 法 作用 是 : 暂停 当前 正在 执行 的 线程 对 象 ， 并 执行 其 他 线程 。yield0 应 
该 做 的 是 让 当前 运行 线程 回 到 可 运行 状态 ， 以 允许 具有 相同 优先 级 的 其 他 线程 获得 运行 机 
会 。 因 此 ， 使 用 yield0 的 目的 是 让 相同 优先 级 的 线程 之 间 能 适当 的 轮转 执行 。 但 是 ， 实 际 
中 无 法 保证 yield0 达 到 让 步 目的 ， 因 为 让 步 的 线程 还 有 可 能 被 线程 调度 程序 再 次 选中 。 

由 此 可 见 ，yield0 从 未 导致 线程 转 到 等 待 /睡眠 /阻塞 状态 。 在 大 多 数 情况 下 ，yield0 将 
导致 线程 从 运行 状态 转 到 可 运行 状态 ， 但 有 可 能 没有 效果 。 

4) join() 方 法 

Thread 的 非 静态 方法 join0 让 一 个 线程 B“ 加 入 ”到 另外 一 个 线程 A 的 尾部 。 在 A 执 
行 完毕 之 前 ，B 不 能 工作 。 例 如 : 


Thread 七 = new MYThread () 7 
tStartdie 
t.join(); 
另外 ，join() 方 法 还 有 带 超时 限制 的 重 载 版 本 。 例 如 tjoin(5000): 则 让 线程 等 待 5000 毫 
秒 ， 如 果 超 过 这 个 时 间 ， 则 停止 等 待 ， 变 为 可 运行 状态 。 线 程 的 加 入 join0 对 线程 栈 导致 
的 结果 是 线程 栈 发 生 了 变化 ， 当 然 这 些 变化 都 是 瞬时 的 。 
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自从 计算 机 诞生 之 日 起 ， 安 全 问题 就 一 直 是 人 们 关心 的 话题 。 在 大 型 商业 
应 用 领域 中 ， 安 全 和 优化 一 直 是 研究 并 发 展 的 重点 。 本 章 将 详细 讲解 VM 安全 
和 优化 方面 的 基本 问题 。 


he 


17.1 线程 安全 


线程 安全 指 的 是 当 多 个 线程 操作 同一 个 数据 段 时 ， 用 相应 的 互 斥 机 制 ， 避 免 数 据 段 中 
的 数据 错误 。 

每 个 线程 尽量 只 访问 别 的 线程 不 访问 的 变量 或 内 存 ， 如 果 硬 是 要 访问 同一 变量 或 内 存 
的 话 ， 就 要 采用 适当 的 互 斥 机 制 来 避免 由 于 线程 切换 而 导致 的 不 确定 性 。“ 线 程 安全 函 
数 ” 就 是 当 你 在 多 线程 程序 中 调用 该 函数 ， 该 函数 本 身 不 会 出 错 ， 并 且 能 得 到 正确 的 结果 
或 处 理 。 


17.1.1 Java 中 的 线程 安全 


我 们 已 经 有 了 线程 安全 的 一 个 抽象 定义 ， 那 接 下 来 我 们 就 讨论 一 下 在 Java 语言 中 ， 线 
程 安全 具体 是 如 何 体现 的 ? 有 哪些 操作 是 线程 安全 的 ? 我 们 这 里 讨论 的 线程 安全 ， 就 限定 
于 多 个 线程 之 间 存 在 共享 数据 访问 这 个 前 提 ， 因 为 如 果 一 段 代码 根本 不 会 与 其 他 线程 共享 
数据 ， 那 么 从 线程 安全 的 角度 上 看 ， 程 序 是 串 行 执行 还 是 多 线程 执行 对 它 来 说 是 完全 没有 
区 别 的 。 

为 了 更 深入 地 理解 线程 安全 ， 在 这 里 我 们 可 以 不 把 线程 安全 当 作 一 个 非 真 即 假 的 二 元 
排 它 选项 来 看 待 ， 按 照 线程 安全 的 “安全 程度 ”由 强 至 弱 来 排序 ， 我 们 可 以 将 Java 语言 中 
各 种 操作 共享 的 数据 分 为 以 下 五 类 : 不 可 变 、 绝 对 线程 安全 、 相 对 线程 安全 、 线 程 兼容 和 
线程 对 立 。 

. 不 可 变 

在 Java 语言 里 面 ( 特 指 JDK 1.5 以 后 ， 即 Java 内 存 模型 被 修正 之 后 的 Java 语言 )， 不 可 
变 (Immutable) 的 对 象 一 定 是 线程 安全 的 ， 无 论 是 对 象 的 方法 实现 还 是 方法 的 调用 者 ， 都 不 
需要 再 进行 任何 的 线程 安全 保障 措施 ， 在 上 一 章 里 我 们 谈 到 过 final 关键 字 带 来 的 可 见 性 时 
曾经 提 到 过 这 一 点 ， 只 要 一 个 不 可 变 的 对 象 被 正确 地 构建 出 来 (没有 发 生 this 引用 逃逸 的 情 
况 )， 那 其 外 部 的 可 见 状 态 永远 也 不 会 改变 ， 永 远 也 不 会 看 到 它 在 多 个 线程 之 中 处 于 不 一 臻 
的 状态 。“ 不 可 变 ” 带 来 的 安全 性 是 最 简单 最 纯粹 的 。 

Java 语言 中 ， 如 果 共享 数据 是 一 个 基本 数据 类 型 ， 那 么 只 要 在 定义 时 使 用 final 关键 字 
修饰 它 就 可 以 保证 它 是 不 可 变 的 。 如 果 共 享 数据 是 一 个 对 象 ， 那 就 需要 保证 对 象 的 行为 不 
会 对 其 状态 产生 任何 影响 才 行 ， 如 果 读 者 还 没 想 明 白 这 句 话 ， 不 妨 想 一 想 java.lang.String 
类 的 对 象 ， 它 是 一 个 典型 的 不 可 变 对 象 ， 我 们 调用 它 的 substring0、replace0 和 concatO 这 
些 方法 都 不 会 影响 它 原 来 的 值 ， 只 会 返回 一 个 新 构造 的 字符 串 对 象 。 

保证 对 象 行为 不 影响 自己 状态 的 途径 有 很 多 种 ， 其 中 最 简单 的 就 是 把 对 象 中 带 有 状态 
的 变量 都 声明 为 fmal， 这 样 在 构造 函数 结束 之 后 ， 它 就 是 不 可 变 的， 例如 演示 代码 17-1 中 
java.lang.Integer 构造 函数 ， 它 通过 将 内 部 状态 变量 value 定义 为 final 来 保障 状态 不 变 。 
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演示 代码 17-1 JDK 中 Integer 类 的 构造 函数 


Private final int value; 
public Integer (int value) { 
this.value=value; 


) 


在 Java API 中 符合 不 可 变 要 求 的 类 型 ， 除 了 上 面 提 到 的 String 之 外 ， 常 用 的 还 有 枚 举 
类 型 ， 以 及 java.lang.Number 的 部 分 子 类 ， 如 Long 和 Double 等 数值 包装 类 型 ，BigInteger 
和 BigDecimal 等 大 数据 类 型 : 但 同 为 Number 的 子 类 型 的 原子 类 Atomiclnteger 和 
AtomicLong 则 并 非 不 可 变 的 ， 读 者 不 妨 看 看 这 两 个 原子 类 的 源码 ， 想 一 想 为 什么 。 


2. 绝对 线程 安全 


绝对 的 线程 安全 完全 满足 Brian Goetz 给 出 的 线程 安全 的 定义 ， 这 个 定义 其 实 是 很 严格 
的 ， 一 个 类 要 达到 “不 管 运行 时 环境 如 何 ， 调 用 者 都 不 需要 任何 额外 的 同步 措施 ”通常 需 
要 付出 很 大 的 ， 甚 至 是 不 切实 际 的 代价 。 在 Java API 中 标注 自己 是 线程 安全 的 类 ， 大 多 数 
都 不 是 绝对 的 线程 安全 。 我 们 可 以 通过 Java API 中 一 个 不 是 “绝对 线程 安全 ”的 线程 安全 
类 来 看 看 这 里 的 “绝对 ”是 什么 意思 。 

如 果 说 java.util.Vector 是 一 个 线程 安全 的 容器 ， 相 信 所 有 的 Java 程序 员 对 此 都 不 会 有 
异议 ， 因 为 它 的 add0、get0 和 size0 这 类 方法 都 是 被 synchronized 修饰 的 ， 尽 管 这 样 效率 
很 低 ， 但 确实 是 安全 的 。 但 是 ， 即 使 它 所 有 的 方法 都 被 修饰 成 同步 ， 也 不 意味 着 调用 它 的 
时 候 永 远 都 不 再 需要 同步 手段 了 ， 请 看 演示 代码 17-2 中 的 测试 代码 。 

演示 代码 17-2 ”测试 Vector 线程 安全 


private static Vector<Integer> vector=new Vector<Integer> ()] 
public static void main(String[] args) { 
while (true) 工 

for (int i=o; ji<10; i++) { 

vector.add (i); 

) 

Thread removeThread=new Thread(new Runnable() { 
override 

public void run() { 

for (inti=o;i(vector.size(); i++) { 

Vector .remove (i); 

} 

} 

1 

Thread printThread=new Thread(new Runnable() { 
@Override 

public void run() { 

for (int i=o; i(vector.size(); i++) { 
system.out .println( (vector.get (i))); 

下 

EB; 

removeThread. Sm 

printThread. start( 

不 要 同 计生 过 多 前线 程 否则 会 导致 操作 系统 假死 
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权衡 优化 、 高 效 和 安全 的 最 优 方 美 


while (Thread.activeCcount () >20); 
} 
} 


运行 结果 如 下 : 
Exception in thread "Thread-172" 
j ava .lang .ArrayIndexOutOfBoundsException: 
Array index out of range: 17 
at java .util.Vector.remove (Vector.java: 777) 


at org. fenixsoft .mulithread. VectorTest$1. run( VectorTest.j ava: 21) 
at java .lang. Thread. run (Thread.java: 662) 


很 明显 ， 尽 管 这 里 使 用 到 的 Vector 的 get0. remove0 和 size() 方 法 都 是 同步 的 ， 但 是 在 
多 线程 的 环境 中 ， 如 果 不 在 方法 调用 端 做 额外 的 同步 措施 ， 使 用 这 段 代 码 仍 然 是 不 安全 
的 ， 因 为 如 果 另 一 个 线程 恰好 在 错误 的 时 间 里 删除 了 一 个 元 素 ， 导 致 序号 i 已 经 不 再 可 用 
的 话 ，get() 方 法 就 会 抛 出 一 个 ArrayIndexOutOfBoundsException。 如 果 要 保证 这 段 代码 能 正 
确 地 执行 下 去 ， 我 们 不 得 不 把 removeThread 和 printThread 的 定义 改 成 如 演示 代码 17-3 所 
示 的 这 样 。 

演示 代码 17-3 ”必须 加 入 同步 以 保证 Vector 访问 的 线程 安全 性 


Thread removeThread=new Thread(new Runnable() { 
QOverride 

public void run() { 

synchronized (vector) { 

for (inti=o; i'vector.size(); i++) { 
vector.remove (i); 

} 

} 

} 

1 

Thread printThread=new Thread(new Runnable() { 
Q@Override 

public void run() { 

synchronized (vector) { 

for (int i=oj i<vector.size(); i++) { 
System.out .println( (vector.get (i))); 

} 

} 

} 

1 


3. 相对 线程 安全 

相对 的 线程 安全 就 是 我 们 通常 意义 上 所 讲 的 线程 安全 ， 它 需要 保证 对 这 个 对 象 单独 的 
操作 是 线程 安全 的 ， 我 们 在 调用 的 时 候 不 需要 做 额外 的 保障 措施 ， 但 是 对 于 一 些 特定 顺序 
的 连续 调用 ， 就 可 能 需要 在 调用 端 使 用 额外 的 同步 手段 来 保证 调用 的 正确 性 。 演 示 代 码 
17-2 和 演示 代码 17-3 就 是 相对 线程 安全 的 一 个 很 明显 的 案例 。 

在 Java 语言 中 ， 大 部 分 的 线程 安全 类 都 属于 这 种 类 型 ， 例 如 Vector、HashTable、 
Collections 的 synchronizedCollection() 方 法 包装 的 集合 等 。 
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4. 线程 兼容 


线程 兼容 是 指 对 象 本 身 并 不 是 线程 安全 的 ， 但 是 可 以 通过 在 调用 端正 确 地 使 用 同步 手 
段 来 保证 对 象 在 并 发 环境 中 安全 地 使 用 ， 我 们 平常 说 一 个 类 不 是 线程 安全 的 ， 绝 大 多 数 指 
的 都 是 这 种 情况 。Java API 中 大 部 分 的 类 都 是 线程 兼容 的 ， 如 与 前 面 的 Vector 和 
HashTable 相对 应 的 集合 类 ArrayList 和 HashMap 等 。 


5. 线程 对 立 


线程 对 立 是 指 不 管 调用 端 是 否 采 取 了 同步 措施 ， 都 无 法 在 多 线程 环境 中 并 发 使 用 的 代 
码 。 由 于 Java 语言 天 生 就 具备 多 线程 特性 ， 线 程 对 立 这 种 排斥 多 线程 的 代码 是 很 少 出 现 
的 ， 而 且 通 常 都 是 有 害 的， 应 当 尽量 避免 。 

一 个 线程 对 立 的 例子 是 Thread 类 的 suspend0 和 resume() 方 法 ， 如 果 有 两 个 线程 同时 持 
有 一 个 线程 对 象 ， 一 个 尝试 去 中 断 线程 ， 一 个 尝试 去 恢复 线程 ， 如 果 并 发 进行 的 话 ， 无 论 
调用 时 是 否 进行 了 同步 ， 目 标 线程 都 是 存在 死 锁 风 险 的 ， 如 果 suspend0 中 断 的 线程 就 是 即 
将 要 执行 resume() 的 那个 线程 ， 那 就 肯定 要 产生 死 锁 了 。 也 正 是 由 于 这 个 原因 ，suspend() 
和 resume() 方 法 已 经 被 JDK 声明 废弃 (@Deprecated) 了 。 常 见 的 线程 对 立 的 操作 还 有 
System.setIn()、Sytem.setOut() 和 System. runFinalizersOnExit() 等 。 


17.1.2 线程 安全 的 实现 方法 


了 解 了 什么 是 线程 安全 之 后 ， 紧 接着 的 一 个 问题 就 是 我 们 应 该 如 何 实现 线程 安全 ， 这 
听 起 来 似乎 是 一 件 由 代码 如 何 编写 来 决定 的 事情 ， 确 实 ， 如 何 实现 线程 安全 与 代码 的 编写 
有 很 大 的 关系 ， 但 虚拟 机 提供 的 同步 和 锁 机 制 也 起 到 了 非常 重要 的 作用 。 本 节 将 介绍 代码 
编写 如 何 实现 线程 安全 和 虚拟 机 如 何 实现 同步 与 锁 ， 相 对 而 言 更 偏重 后 者 一 些 ， 只 要 读者 
了 解 了 虚拟 机 线程 安全 手段 的 运作 过 程 ， 自 己 去 思考 代码 如 何 编写 并 不 是 一 件 困难 的 
事情 。 

1. 互 斥 同步 


互 斥 同步 (Mutual Exclusion&Synchronization) 是 最 常见 的 一 种 并 发 正确 性 保障 手段 ， 同 
步 是 指 在 多 个 线程 并 发 访问 共享 数据 时 ， 保 证 共享 数据 在 同一 个 时 刻 只 被 一 条 (或 者 是 一 
些 ， 使 用 信号 量 的 时 候 ) 线 程 使 用 。 而 互 斥 是 实现 同步 的 一 种 手段 ， 临 界 区 (Critical 
Sectiom)、 互 斥 量 (Mutex) 和 信号 量 (Semaphore) 都 是 主要 的 互 斥 实现 方式 。 

因此 在 这 四 个 字 里 面 ， 互 斥 是 因 ， 同 步 是 果 ， 互 斥 是 方法 ， 同 步 是 目的 。 在 Java 里 
面 ， 最 基本 的 互 斥 同步 手段 就 是 synchronized 关键 字 ，synchronized 关键 字 经 过 编译 之 后 ， 
会 在 同步 块 的 前 后 分 别 形成 monitorenter 和 monitorexit 这 两 个 字 节 码 指令 ， 这 两 个 字 节 码 
都 需要 一 个 reference 类 型 的 参数 来 指明 要 锁定 和 解锁 的 对 象 。 如 果 Java 程序 中 的 
synchronized 明确 指定 了 对 象 参 数 ， 那 就 是 这 个 对 象 的 reference; 如 果 没 有 明确 指定 ， 那 
就 根据 synchronized 修饰 的 是 实例 方法 还 是 类 方法 ， 去 取 对 应 的 对 象 实例 或 Class 对 象 来 
作为 锁 对 象 。 

根据 虚拟 机 规范 的 要 求 ， 在 执行 monitorenter 指令 时 ， 首 先 要 去 尝试 获取 对 象 的 锁 。 
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开发 : 
、 高 效 和 安全 的 最 优 
如 果 这 个 对 象 没 被 锁定 ， 或 者 当前 线程 已 经 拥有 了 那个 对 象 的 锁 ， 把 锁 的 计数 器 加 1， 相 
应 地 ， 在 执行 monitorexit 指令 时 会 将 锁 计 数 器 减 1， 当 计数 器 为 0 时 ， 锁 就 被 释放 了 。 如 
果 获 取 对 象 锁 失败 了 ， 那 当前 线程 就 要 阻塞 等 待 ， 直 到 对 象 锁 被 男 外 一 个 线程 释放 为 止 。 

在 虚拟 机 规范 对 monitorenter 和 monitorexit 的 行为 描述 中 ， 有 两 点 是 需要 特别 注意 
的 。 首 先 ，synchronized 同步 块 对 同一 条 线程 来 说 是 可 重 入 的 ， 不 会 出 现 自己 把 自己 锁 死 
的 问题 。 其 次 ， 同 步 块 在 已 进入 的 线程 执行 完 之 前 ， 会 阻塞 后 面 其 他 线程 的 进入 。 上 一 章 
讲 过 ，Java 的 线程 是 映射 到 操作 系统 的 原生 线程 之 上 的 ， 如 果 要 阻塞 或 唤醒 一 条 线程 ， 都 
需要 操作 系统 来 帮忙 完成 ， 这 就 需要 从 用 户 态 转换 到 核心 态 中 ， 因 此 状态 转换 需要 耗费 很 
多 的 处 理 器 时 间 。 对 于 代码 简单 的 同步 块 (如 被 synchronized 修饰 的 getter0) 或 setter() 方 
法 )， 状 态 转换 消耗 的 时 间 可 能 比 用 户 代码 执行 的 时 间 还 要 长 。 所 以 synchronized 是 Java 
语言 中 一 个 重量 级 (Heavyweight) 的 操作 ， 有 经 验 的 程序 员 都 会 在 确实 必要 的 情况 下 才 使 用 
这 种 操作 。 而 虚拟 机 本 身 也 会 进行 一 些 优 化 ， 壁 如 在 通知 操作 系统 阻塞 线程 之 前 加 入 一 段 
自 旋 等 待 过 程 ， 避 免 频 繁 地 切入 到 核心 态 之 中 。 

除了 synchronized 之 外 ， 我 们 还 可 以 使 用 java.util.concurrent( 下 文 称 JU.C) 包 中 的 重 入 
锁 (ReentrantLock) 来 实现 同步 ， 在 基本 用 法 上 ，ReentrantLock 与 synchronized 很 相似 ， 他 
们 都 具备 一 样 的 线程 重 入 特性 ， 只 是 代码 写法 上 有 点 区 别 ， 一 个 表现 为 API 层面 的 互 斥 锁 
(lock0 和 unlock() 方 法 配合 try/finally 语句 块 来 完成 )， 一 个 表现 为 原生 语法 层面 的 互 斥 锁 。 
不 过 ReentrantLock 比 synchronized 增加 了 一 些 高 级 功能 ， 主 要 有 三 项 : 等 待 可 中 断 、 可 实 
现 公平 锁 ， 以 及 锁 可 以 绑 定 多 个 条 件 。 

口 “ 等 待 可 中 断 是 指 当 持 有 锁 的 线程 长 期 不 释放 锁 的 时 候 ， 正 在 等 待 的 线程 可 以 选择 
放弃 等 待 ， 改 为 处 理 其 他 事情 ， 可 中 断 特性 对 处 理 执行 时 间 非 常 长 的 同步 块 很 有 
帮助 。 

口 “ 可 实现 公平 锁 是 指 多 个 线程 在 等 待 同一 个 锁 时 ， 必 须 按照 申请 锁 的 时 间 顺 序 来 依 
次 获得 锁 ; 而 非 公平 锁 则 不 保证 这 一 点 ， 在 锁 被 释放 时 ， 任 何 一 个 等 待 锁 的 线程 
都 有 机 会 获得 锁 。synchronized 中 的 锁 是 非 公平 的 ，ReentrantLock 默认 情况 下 也 
是 非 公平 的 ， 但 可 以 通过 带 布尔 值 的 构造 函数 要 求 使 用 公平 锁 。 

口 ” 锁 可 以 绑 定 多 个 条 件 是 指 一 个 ReentrantLock 对 象 可 以 同时 绑 定 多 个 Condition 对 
象 ， 而 在 synchronized 中 ， 锁 对 象 的 wait0 和 notify0 或 notifyAll0 方 法 可 以 实现 一 
个 隐 含 的 条 件 ， 如 果 要 和 多 于 一 个 的 条 件 关 联 的 时 候 ， 就 不 得 不 额外 地 添加 一 个 
锁 ， 而 ReentrantLock 则 无 需 这 样 做 ， 只 需要 多 次 调用 newCondition() 方 法 即 可 。 

如 果 需 要 使 用 到 上 述 功 能 的 时 候 ， 选 用 ReentrantLock 是 一 个 很 好 的 选择 ， 那 如 果 是 

基于 性 能 考虑 呢 ? 经 过 实践 证 明 ， 多 线程 环境 下 synchronized 的 吞吐 量 下 降 得 非常 严重 ， 

而 ReentrantLock 则 能 基本 保持 在 同一 个 比较 稳定 的 水 平 上 。 与 其 说 ReentrantLock 性 能 
好 ， 倒 还 不 如 说 synchronized 还 有 非常 大 的 优化 余地 。 后 续 的 技术 发 展 也 证 明了 这 一 点 ， 

JDK 16 中 加 入 了 很 多 针对 锁 的 优化 措施 (下 一 节 我 们 就 会 讲解 这 些 优化 措施 )，JDK 1.6 发 布 
之 后 ， 人 们 就 发 现 synchronized 与 ReentrantLock 的 性 能 基本 上 是 完全 持平 了 。 因 此 如 果 读 
者 的 程序 是 使 用 JDK 1.6 部 署 的 话 ， 性 能 因素 就 不 再 是 选择 ReentrantLock 的 理由 了 ， 虚 拟 
机 在 未 来 的 性 能 改进 中 肯定 也 会 更 加 偏向 于 原生 的 synchronized， 所 以 还 是 提倡 在 
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synchronized 能 实现 需求 的 情况 下 ， 优 先 考虑 使 用 synchronized 来 进行 同步 。 
2. 非 阻塞 同步 


互 斥 同步 最 主要 的 问题 就 是 进行 线程 阻塞 和 唤醒 所 带 来 的 性 能 问题 ， 因 此 这 种 同步 也 
被 称 为 阻塞 同步 (Blocking Synchronization)。 另 外 ， 它 属于 一 种 翡 观 的 并 发 策略 ， 总 是 认为 
只 要 不 去 做 正确 的 同步 措施 (加 锁 )， 那 就 肯定 会 出 现 问 题 ， 无 论 共享 数据 是 否 真 的 会 出 现 
竞争 ， 它 都 要 进行 加 锁 ( 这 里 说 的 是 概念 模型 ， 实 际 上 虚拟 机 会 优化 掉 很 大 一 部 分 不 必要 的 
加 锁 )、 用 户 态 核心 态 转换 、 维 护 锁 计 数 器 和 检查 是 否 有 被 阻塞 的 线程 需要 被 唤醒 等 操作 。 
随 着 硬件 指令 集 的 发 展 ， 我 们 有 了 另外 一 个 选择 : 基于 冲突 检测 的 乐观 并 发 策略 ， 通 俗 地 
说 就 是 先进 行 操作 ， 如 果 没 有 其 他 线程 争 用 共享 数据 ， 那 操作 就 成 功 了 ; 如果 共享 数据 有 
争 用 ， 产 生 了 冲突 ， 那 就 再 进行 其 他 的 补偿 措施 (最 常见 的 补偿 措施 就 是 不 断 地 重 试 ， 直 到 
试 成 功 为 止 )， 这 种 乐观 的 并 发 策略 的 许多 实现 都 不 需要 把 线程 挂 起 ， 因 此 这 种 同步 操作 被 
称 为 非 阻塞 同步 (Non-Blocking Synchronization)。 

为 什么 笔者 说 使 用 乐观 并 发 策略 需要 “硬件 指令 集 的 发 展 ”才能 进行 呢 ? 因为 我 们 需 
要 操作 和 冲突 检测 这 两 个 步骤 具备 原子 性 ， 靠 什么 来 保证 呢 ? 如 果 这 里 再 使 用 互 斥 同步 来 
保证 就 失去 意义 了 ， 所 以 我 们 只 能 靠 硬件 来 完成 这 件 事情 ， 硬 件 保证 一 个 从 语义 上 看 起 来 
需要 多 次 操作 的 行为 只 通过 一 条 处 理 器 指令 就 能 完成 ， 这 类 指令 常用 的 有 : 

口 ”测试 并 设置 (Test-and-Set); 

口 ”获取 并 增加 (Fetch-and-Increment): 

口 ”交换 (Swap); 

口 ”比较 并 交换 (Compare-and-Swap， 下 文 称 CAS); 

口 ” 加 载 链 接 / 条 件 储 存 (Load-Linked / Store-Conditional， 下 文 称 LL/SC)。 

其 中 ， 前 面 的 三 条 是 上 个 世纪 就 已 经 存在 于 大 多 数 指令 集 之 中 的 处 理 器 指令 ， 后 面 的 
两 条 是 现代 处 理 器 新 增 的 ， 而 且 这 两 条 指令 的 目的 和 功能 是 类 似 的。 在 IA64、x86 指令 集 
中 通过 cmpxchg 指令 完成 CAS 功能 ， 在 sparc-TSO 中 也 有 casa 指令 实现 ， 而 在 ARM 和 
PowerPC 架构 下 ， 则 需要 使 用 一 对 ldrex/strex 指令 来 完成 LL/SC 的 功能 。 

CAS 指令 需要 有 三 个 操作 数 ， 分 别 是 内 存 位置 ( 在 Java 中 可 以 简单 理解 为 变量 的 内 存 
地 址 ， 用 V 表示 )、 旧 的 预期 值 (用 A 表示 ) 和 新 值 (用 B 表示 )。CAS 指令 执行 时 ， 当 且 仅 
当 V 符合 旧 预 期 值 A 时 ， 处 理 器 用 新 值 B 更 新 V 的 值 ， 否 则 它 就 不 执行 更 新 ， 但 是 不 管 
是 否 更 新 了 V 的 值 ， 都 会 返回 V 的 旧 值 ， 上 述 的 处 理 过 程 是 一 个 原子 操作 。 

在 JDK 1.5 之 后 ，Java 程序 中 才 可 以 使 用 CAS 操作 ， 该 操作 由 sun.misc.Unsafe 类 里 面 
的 compareAndSwapInt0 和 compareAndSwapLong() 等 几 个 方法 包装 提供 ， 虚 拟 机 在 内 部 对 
这 些 方 法 做 了 特殊 处 理 ， 即 时 编译 出 来 的 结果 就 是 一 条 平台 相关 的 处 理 器 CAS 指令 ， 没 
有 方法 调用 的 过 程 ， 或 者 可 以 认为 是 无 条 件 内 联 进 去 了 。 

由 于 Unsafe 类 不 是 提供 给 用 户 程序 调用 的 类 (Unsafe.getUnsafe() 的 代码 中 限制 了 只 有 
启动 类 加 载 器 (Bootstrap ClassLoader) 加 载 的 Class 才能 访问 它 )， 如 果 不 采 用 反射 手段 ， 我 
们 只 能 通过 其 他 的 Java API 来 间接 使 用 它 ， 如 JU.C 包 里 面 的 整数 原子 类 ， 其 中 的 
compareAndSet0 和 getAndIncrement() 等 方法 都 使 用 了 Unsafe 类 的 CAS 操作 。 

我 们 不 妨 拿 一 段 在 上 一 章 中 没有 解决 的 问题 代码 来 看 看 如 何 使 用 CAS 操作 来 避免 阻 
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塞 同步 。 
例如 下 面 的 一 段 代 码 。 


public class VolatileTest { 
public static volatile int race=0 ; 
public static void increase() { 
racet+; 
) 
private static final int THREADS COUNT=20; 
public static void main (String[] args) { 
Thread[] threads=new Thread[THREADS COUNT]; 
for (int i=0; i<THREADS—COUNT; i++) { 
threads[i] =new Thread (new Runnable() { 
@Override 
public void run(){ 
for (inti=o; i(10000; i++) { 
increase (); 
) 
)h 
threads [i].start()j 


» 等 待 所 有 累加 线程 都 结束 

while (Thread.activeCount() >1) 
Thread.yield()j 
System.out.println (race); 

: 

上 述 代码 发 起 了 20 个 线程 ， 每 个 线程 对 race 变量 进行 10000 次 自 增 操 作 ， 如 果 这 段 
代码 能 够 正确 并 发 的 话 ， 最 后 输出 的 结果 应 该 是 200000。 读 者 运行 完 这 段 代码 之 后 ， 并 不 
会 获得 期 望 的 结果 ， 而 且 会 发 现 每 次 运行 程序 ， 输 出 的 结果 都 不 一 样 ， 都 是 一 个 小 于 
200000 的 数字 ， 这 是 为 什么 呢 ? 问题 就 出 现在 自 增 运算 “race++” 之 中 ， 我 们 用 Javap 反 
编译 这 段 代 码 后 会 发 现 只 有 一 行 代码 的 increase() 方 法 在 Class 文件 中 是 由 4 条 字 节 码 指令 
构成 的 (retum 指令 不 是 由 racet+ 产 生 的 ， 这 条 指令 可 以 不 算 )， 从 字 节 码 层面 上 很 容易 就 分 
析出 并 发 失败 的 原因 了 : 当 getstatic 指令 把 race 的 值 取 到 操作 栈 顶 时 ，volatile 关键 字 保 证 
了 race 的 值 在 此 时 是 正确 的 ， 但 是 在 执行 iconst1、iadd 这 些 指令 的 时 候 ， 其 他 线程 可 能 
已 经 把 race 的 值 加 大 了 ， 而 在 操作 栈 顶 的 值 就 变 成 了 过 期 的 数据 ， 所 以 putstatic 指令 执行 
后 就 可 能 把 较 小 的 race 值 同步 回 主 内 存 之 中 。 

如 何 才能 让 它 具 备 原子 性 呢 ? 把 “race++” 操 作 或 increase() 方 法 用 同步 块 包 衷 起 来 当 
然 是 一 个 办 法 ， 但 是 如 果 改 成 演示 代码 17-4 的 代码 ， 那 效率 将 会 提高 许多 。 

演示 代码 17-4 Atomic 的 原子 自 增 运算 


public class AtomicTest { 

public static AtomicInteger race=new AtomicInteger(0)j 
public static void increase() { 

race .incrementAndGet (); 

} 

private static final int THREADS COUNT=20; 
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public static void main{String[] args) throws Exception{ 
Thread[] threads=new Thread [THREADS COUNT]; 
for (int ji=oj i(THREADS—COUNT; i++) { 
threads [i] =new Thread (new Runnable() { 
@Override 
public void run() { 
for (int i=o;i<10000; i++) { 
increase (); 
F 
+ 
Ey 
threads LiJ .start(); 
} 
while (Thread.activeCount() >1) 
Thread.yield():; 
System.out.println (race); 
} 
| 
运行 结果 如 下 : 


200000 


使 用 AtomicInteger 代替 int 后 ， 程 序 输出 了 正确 的 结果 ， 一 切 都 要 归功 于 
incrementAndGet() 方 法 在 一 个 无 限 循环 中 ， 不 断 尝 试 将 一 个 比 当前 值 大 1 的 新 值 赋值 给 自 
己 。 如 果 失 败 了 ， 那 说 明 在 执行 “获取 一 设置 ”操作 的 时 候 值 已 经 有 了 修改 ， 于 是 再 次 循 
环 进行 下 一 次 操作 ， 直 到 设置 成 功 为 止 。 

尽管 CAS 看 起 来 很 美 ， 但 显然 这 种 操作 无 法 涵盖 互 斥 同步 的 所 有 使 用 场景 ， 并 且 
CAS 从 语义 上 来 说 并 不 是 完美 的 ， 存 在 这 样 的 一 个 逻辑 漏洞 : 如 果 一 个 变量 V 初次 读 取 的 
时 候 是 A 值 ， 并 且 在 准备 赋值 的 时 候 检查 到 它 仍然 为 A 值 ， 那 我 们 就 能 说 它 的 值 没有 被 
其 他 线程 改变 过 了 吗 ? 如 果 在 这 段 期 间 它 的 值 曾经 被 改 成 了 B， 后 来 又 被 改 回 为 A， 那 
CAS 操作 就 会 误 认 为 它 从 来 没有 被 改变 过 。 这 个 漏洞 称 为 CAS 操作 的 “ABA” 问 题 。 
JU.C 包 为 了 解决 这 个 问题 ， 提 供 了 一 个 带 有 标记 的 原子 引用 类 “ AtomicStamped 
Reference”， 它 可 以 通过 控制 变量 值 的 版 本 来 保证 CAS 的 正确 性 。 不 过 目前 来 说 这 个 类 
比较 鸡肋 ， 大 部 分 情况 下 ABA 问题 不 会 影响 程序 并 发 的 正确 性 ， 如 果 需 要 解决 ABA 问 
题 ， 改 用 传统 的 互 斥 同步 可 能 会 比 原子 类 更 高 效 。 


3. 无 同步 方案 


要 保证 线程 安全 ， 并 不 是 一 定 就 要 进行 同步 ， 两 者 没有 因果 关系 。 同 步 只 是 保障 共享 
数据 争 用 时 的 正确 性 的 手段 ， 如 果 一 个 方法 本 来 就 不 涉及 共享 数据 ， 那 它 自 然 就 无 需 任何 
同步 措施 去 保证 正确 性 ， 因 此 会 有 一 些 代码 天 生 就 是 线程 安全 的 ， 笔 者 简单 介绍 其 中 的 
两 类 。 

可 重 入 代码 (Reentrant Code): 这 种 代码 也 叫 纯 代码 (Pure Code)， 可 以 在 代码 执行 的 任 
何 时 刻 中 断 它 ， 转 而 去 执行 另外 一 段 代码 (包括 递归 调用 它 本 身 )， 而 在 控制 权 返 回 后 ， 原 
来 的 程序 不 会 出 现任 何 错误 。 相 对 线程 安全 来 说 ， 可 重 人 性 是 更 基本 的 特性 ， 它 可 以 保证 
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线程 安全 ， 即 所 有 的 可 重 入 的 代码 都 是 线程 安全 的 ， 但 是 并 非 所 有 的 线程 安全 的 代码 都 是 
可 重 入 的 。 

可 重 入 代码 有 一 些 共 同 的 特征 : 例如 不 依赖 存储 在 堆 上 的 数据 和 公用 的 系统 资源 、 用 
到 的 状态 量 都 由 参数 中 传 入 、 不 调用 非 可 重 入 的 方法 等 。 我 们 可 以 通过 一 个 简单 一 些 的 原 
则 来 判断 代码 是 否 具备 可 重 人 性 : 如 果 一 个 方法 ， 它 的 返回 结果 是 可 以 预测 的 ， 只 要 输入 
了 相同 的 数据 ， 就 都 能 返回 相同 的 结果 ， 那 它 就 满足 可 重 入 性 的 要 求 ， 当 然 也 就 是 线程 安 
全 的 。 

线程 本 地 存储 (Thread Local Storage): 如 果 一 段 代 码 中 所 需要 的 数据 必须 与 其 他 代码 共 
享 ， 那 就 看 看 这 些 共享 数据 的 代码 是 否 能 保证 在 同一 个 线程 中 执行 ? 如 果 能 保证 ， 我 们 就 
可 以 把 共享 数据 的 可 见 范围 限制 在 同一 个 线程 之 内 ， 这 样 ， 无 需 同 步 也 能 保证 线程 之 间 不 
出 现 数据 争 用 的 问题 。 

符合 这 种 特点 的 应 用 并 不 少见 ， 大 部 分 使 用 消费 队列 的 架构 模式 (如 “生产 者 一 消费 
者 ”模式 ) 都 会 将 产品 的 消费 过 程 尽 量 在 一 个 线程 中 消费 完 ， 其 中 最 重要 的 一 个 应 用 实例 就 
是 经 典 Web 交互 模型 中 的 “一 个 请 求 对 应 一 个 服务 器 线程 ”(Thread-per-Request) 的 处 理 方 
式 ， 这 种 处 理 方式 的 广泛 应 用 使 得 Web 服务 端的 很 多 应 用 都 可 以 使 用 线程 本 地 存储 来 解决 
线程 安全 问题 。 

Java 语言 中 ， 如 果 一 个 变量 要 被 多 线程 访问 ， 可 以 使 用 volatile 关键 字 声明 它 为 “ 易 
变 的 ”， 如 果 一 个 变量 要 被 某 个 线程 独 享 ， 因 为 Java 中 没有 类 似 C++ 中 _declspec(thread) 
这 样 的 关键 字 ， 不 过 可 以 通过 java.lang.TbreadLocal 类 来 实现 线程 本 地 存储 的 功能 。 每 一 
个 线程 的 Thread 对 象 中 都 有 一 个 ThreadLocaIMap 对 象 ， 这 个 对 象 存储 了 一 组 以 
ThreadLocal.threadLocalHashCode 为 键 ， 以 本 地 线程 变量 为 值 的 K-V 值 对 ，ThreadLocal 对 
象 就 是 当前 线程 的 ThreadLocaIMap 的 访问 入 口 ， 每 一 个 ThreadLocal 对 象 都 包含 了 一 个 独 
一 无 二 的 threadLocalHashCode 值 ， 使 用 这 个 值 就 可 以 在 线程 K-V 值 对 中 找 回 对 应 的 本 地 
线程 变量 。 


17.1.3 无 状态 类 


线程 安全 的 类 一 般 是 无 状态 的 对 象 ， 或 者 类 里 面 的 变量 是 不 可 变 的 ， 下 面 举例 说 明 什 
么 是 无 状态 类 。 


public class StatelessFactorizer implements Servlet { 
public void service (ServletRequest req, ServletResponse resp) { 
BigInteger i = extractFromRequest (req); 
BigInteger[] factors = factor(i); 
encodeIntoResponse (resp, factors); 
} 
} 


线程 安全 与 线程 模型 有 关系 ， 因 为 每 个 线程 都 有 自己 的 变量 ， 并 且 变 量 放 在 自己 的 线 
程 堆栈 中 (除了 共享 变量 )， 所 以 说 无 论 多 个 线程 怎么 访问 ， 该 线程 类 都 是 安全 。 
也 许 有 人 会 问 是 什么 样 的 操作 是 原子 性 的 呢 ? 那么 举 个 例子 : 


Count++; 


人 
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这 个 操作 是 原子 性 的 吗 ? 好 像 单 道 程 序 中 该 操作 是 原子 性 的 ， 但 在 多 线程 中 该 操作 不 
是 原子 性 的 ;该 操作 分 为 读 、 修 改 、 写 入 ， 因 此 该 操作 就 会 在 多 个 线程 中 执行 时 会 被 切 
换 ， 也 就 说 明 该 操作 会 在 执行 过 程 中 被 切换 给 下 一 个 线程 。 

看 下 面 的 代码 : 


public class UnsafeCountingFactorizer implements Servlet { 
Private long count = 0; 


public long getCount () { return count; } 


public void service (ServletRequest req, ServletResponse resp) { 
BigInteger i = extractFromRequest (req); 
BigInteger[] factors = factor(i); 
++count; 
encodeIntoResponse (resp, factors); 
} 
} 
上 述 例 子 有 一 个 私有 的 但 是 多 个 线程 共享 的 变量 ， 而 在 Service 方法 中 该 方法 体 里 面 
执行 了 ++count， 所 以 该 类 不 是 线程 安全 的 。 类 失去 原子 性 操作 的 另 一 个 典型 是 : 检查 在 运 


行 ， 下 面 就 为 大 家 举 个 单 例 模式 中 的 懒 加 载 问题 。 


public class LazyInitRace { 
private ExpensiveObject instance = null; 
public ExpensiveObject getInstance() { 
if (instance == null) 
instance = new ExpensiveObject (); 
return instance; 
} 
} 
大 家 可 能 会 一 下 子 知 道 这 个 没有 什么 问题 ， 但 是 在 多 线程 中 运行 该 getInstance 方法 
时 ， 有 可 能 两 个 或 以 上 的 线程 会 判断 instance 为 空 。 所 以 说 要 尽量 在 判断 和 新 建 对 象 的 时 
候 不 要 被 线程 切换 ， 也 就 是 说 保持 操作 的 原子 性 的 时 候 那 么 该 类 就 是 线程 安全 。 
下 面 为 大 家 阐明 上 面 出 现 的 两 个 问题 的 解决 方案 : 
(1) 要 想 解 决 原子 性 的 操作 就 需要 给 这 些 操作 加 锁 。 
(2) 要 让 每 个 线程 知道 ， 当 有 个 线程 修改 对 象 或 者 修改 变量 时 ， 其 他 线程 都 要 可 见 ， 
这 个 关系 到 JVM 的 类 存 模 型 。 
首先 第 一 个 问题 read-modify-write 解决 方案 ,我 们 引用 了 JDK 包 中 的 
java.lang.concurrent.atomic， 该 包 里 面 可 以 让 变量 保持 原子 性 操作 ， 具 体 类 的 简单 介绍 如 下 


所 示 。 
口 AtomicBoolean: 可 以 用 原子 方式 更 新 的 boolean 值 。 
口 ”AtomicInteger: 可 以 用 原子 方式 更 新 的 int 值 。 
口 ”AtomicIntegerArray: 可 以 用 原子 方式 更 新 其 元 素 的 int 数组 。 
口 “AtomicIntegerFieldUpdater<T> : 基于 反射 的 实用 工具 ， 可 以 对 指定 类 的 指定 


volatile int 字段 进行 原子 更 新 。 
口 AtomicLong: 可 以 用 原子 方式 更 新 的 long 值 。 
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口 ”AtomicLongArray: 可 以 用 原子 方式 更 新 其 元 素 的 long 数组 。 

口 ”AtomicLongFieldUpdater<T>: 基于 反射 的 实用 工具 ， 可 以 对 指定 类 的 指定 
volatile long 字段 进行 原子 更 新 。 

口 AtomicMarkableReference<V>: AtomicMarkableReference 维护 带 有 标记 位 的 对 象 
引用 ， 可 以 原子 方式 对 其 进行 更 新 。 

口 AtomicReference<V>: 可 以 用 原子 方式 更 新 的 对 象 引用 。 

口 AtomicReferenceArray<E>: 可 以 用 原子 方式 更 新 其 元 素 的 对 象 引用 数组 。 

口 ”AtomicReferenceFieldUpdater<T,V>: 基于 反射 的 实用 工具 ， 可 以 对 指定 类 的 指定 
volatile 字段 进行 原子 更 新 。 

口 AtomicStampedReference<V>: AtomicStampedReference 维护 带 有 整数 “标志 ” 
的 对 象 引 用 ， 可 以 用 原子 方式 对 其 进行 更 新 。 

例如 下 面 的 代码 : 


public class CountingFactorizer implements Servlet { 
private final AtomicLong count = new AtomicLong (0); 


public long getCount() { return count.get(); } 


public void service (ServletRequest req, ServletResponse resp) { 
BigInteger i = extractFromRequest (req); 
BigInteger[] factors = factor(i); 
count.incrementAndGet (); 
encodeIntoResponse (resp, factors); 
} 
} 


第 二 个 问题 解决 方案 就 是 加 上 关键 字 sychronized。 
17.2 锁 优 化 


高 效 并 发 是 JDK 1.6 的 一 个 重要 主题 ，HotSpot 虚拟 机 开发 团队 在 这 个 版 本 上 花费 了 大 
量 的 精力 去 实现 各 种 锁 优 化 技术 ， 如 适应 性 自 旋 (Adaptive Spinning)、 锁 消除 (Lock 
Elimination)、 锁 粗 化 (Lock Coarsening)、 轻 量 级 锁 (Lightweight Locking)、 偏 向 锁 (Biased 
Locking) 等 ， 这 些 技术 都 是 为 了 在 线程 之 间 更 高 效 地 共享 数据 ， 以 及 解决 竞争 问题 ， 从 而 
提高 程序 的 执行 效率 。 


17.2.1 ” 自 旋 锁 与 自 适应 自 旋 


前 面 我 们 讨论 互 斥 同步 的 时 候 ， 提 到 了 互 斥 同步 对 性 能 最 大 的 影响 是 阻塞 的 实现 ， 挂 
起 线程 和 恢复 线程 的 操作 都 需要 转 入 内 核 态 中 完成 ， 这 些 操作 给 系统 的 并 发 性 能 带 来 了 很 
大 的 压力 。 同 时 ， 虚 拟 机 的 开发 团队 也 注意 到 在 许多 应 用 上 ， 共 享 数据 的 锁定 状态 只 会 持 
续 很 短 的 一 段 时 间 ， 为 了 这 段 时 间 去 挂 起 和 恢复 线程 并 不 值得 。 如 果 物 理 机 器 有 一 个 以 上 
的 处 理 器 ， 能 让 两 个 或 以 上 的 线程 同时 并 行 执 行 ， 我 们 就 可 以 让 后 面 请 求 锁 的 那个 线程 


KE. 
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“ 稍 等 一 会 儿 ”， 但 不 放弃 处 理 器 的 执行 时 间 ， 看 看 持 有 锁 的 线程 是 否 很 快 就 会 释放 锁 。 
为 了 让 线程 等 待 ， 我 们 只 需 让 线程 执行 一 个 忙 循环 ( 自 旋 )， 这 项 技术 就 是 所 谓 的 自 旋 锁 。 

自 旋 锁 在 JDK 14.2 中 就 已 经 引入 ， 只 不 过 默认 是 关闭 的 ， 可 以 使 用 -XX: 
+UseSpinning 参数 来 开启 ， 在 JDK 1.6 中 就 已 经 改 为 默认 开启 了 。 自 旋 等 待 不 能 代替 阻 
塞 ， 且 先 不 说 对 处 理 器 数量 的 要 求 ， 自 旋 等 待 本 身 虽 然 避免 了 线程 切换 的 开销 ， 但 它 是 要 
占用 处 理 器 时 间 的 ， 所 以 如 果 锁 被 占用 的 时 间 很 短 ， 自 旋 等 待 的 效果 就 会 非常 好 ， 反 之 如 
果 锁 被 占用 的 时 间 很 长 ， 那 么 自 旋 的 线程 只 会 白白 消耗 处 理 器 资源 ， 而 不 会 做 任何 有 用 的 
工作 ， 反 而 会 带 来 性 能 的 浪费 。 因 此 自 旋 等 待 的 时 间 必 须要 有 一 定 的 限度 ， 如 果 自 旋 超 过 
了 限定 的 次 数 仍然 没有 成 功 获 得 锁 ， 就 应 当 使 用 传统 的 方式 去 挂 起 线程 了 。 自 旋 次 数 的 默 
认 值 是 10 次 ， 用 户 可 以 使 用 参数 -XX:PreBlockSpin 来 更 改 。 

在 JDK 16 中 引入 了 自 适 应 的 自 旋 锁 。 自 适应 意味 着 自 旋 的 时 间 不 再 固定 了 ， 而 是 由 
前 一 次 在 同一 个 锁 上 的 自 旋 时 间 及 锁 的 拥有 者 的 状态 来 决定 。 如 果 在 同一 个 锁 对 象 上 ， 自 
旋 等 待 刚刚 成 功 获得 过 锁 ， 并 且 持 有 锁 的 线程 正在 运行 中 ， 那 么 虚拟 机 就 会 认为 这 次 自 旋 
也 很 有 可 能 再 次 成 功 ， 进 而 它 将 允许 自 旋 等 待 持续 相对 更 长 的 时 间 ， 比 如 100 个 循环 。 另 
一 方面 ， 如 果 对 于 某 个 锁 ， 自 旋 很 少 成 功 获得 过 ， 那 在 以 后 要 获取 这 个 锁 时 将 可 能 省 略 掉 
自 旋 过 程 ， 以 避免 浪费 处 理 器 资源 。 有 了 自 适应 自 旋 ， 随 着 程序 运行 和 性 能 监控 信息 的 不 
断 完善 ， 虚 拟 机 对 程序 锁 的 状况 预测 就 会 越 来 越 准确 ， 虚 拟 机 就 会 变 得 越 来 越 “ 聪 
明 ” 了 。 


17.2.2” 锁 消除 


锁 消除 是 指 虚拟 机 即时 编译 器 在 运行 时 ， 对 一 些 代码 上 要 求 同 步 ， 但 是 被 检测 到 不 可 
能 存在 共享 数据 竞争 的 锁 进 行 消除 。 锁 消除 的 主要 判定 依据 来 源 于 逃逸 分 析 的 数据 支持 ， 
如 果 判 断 到 一 段 代 码 中 ， 在 堆 上 的 所 有 数据 都 不 会 逃逸 出 去 被 其 他 线程 访问 到 ， 那 就 可 以 
把 它们 当做 栈 上 数据 对 待 ， 认 为 它们 是 线程 私有 的 ， 同 步 加 锁 自然 就 无 需 进 行 。 

也 许 读者 会 有 疑问 ， 变 量 是 否 逃 逸 ， 对 于 虚拟 机 来 说 需要 使 用 数据 流 分 析 来 确定 ， 但 
是 程序 员 自己 应 该 是 很 清楚 的 ， 怎 么 会 在 明知 道 不 存在 数据 争 用 的 情况 下 要 求 同 步 呢 ? 答 
案 是 有 许多 同步 措施 并 不 是 程序 员 自己 加 入 的 ， 同 步 的 代码 在 Java 程序 中 的 普遍 程度 也 许 
超过 了 大 部 分 读者 的 想象 。 我 们 来 看 看 下 面 演示 代码 17-5 中 的 例子 ， 这 段 非常 简单 的 代码 
仅仅 是 输出 三 个 字符 串 相 加 的 结果 ， 无 论 是 源码 字面 上 还 是 程序 语义 上 都 没有 同步 。 

演示 代码 17-5 


public String concatString(String sl, String s2, String s3) { 

return sl + s2 + s3; 

} 

由 于 String 是 一 个 不 可 变 的 类 ， 对 字符 串 的 连接 操作 总 是 通过 生成 新 的 String 对 象 来 
进行 的 ， 因 此 Javac 编译 器 会 对 String 连接 做 自动 优化 。 在 JDK 15 之 前 ， 会 转化 为 
StringBuffer 对 象 的 连续 append0 〇 操作， 在 JDK15 及 以 后 的 版 本 中 ， 会 转化 为 StringBuilder 
对 象 的 连续 append0 操 作 。 即 演示 代码 17-5 中 的 代码 可 能 会 变 成 演示 代码 17-6 的 样子 。 
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演示 代码 17-6 


public String concatString(String sl, String s2, String s3) { 
StringBuffer sb = new StringBuffer(); 
sb.append(s1); 
sb.append (s2); 
sb.append (s3); 
return sb.tostring(); 


现在 大 家 还 认为 这 段 代 码 没 有 涉及 同步 吗 ? 每 个 StringBuffer.append0 方 法 中 都 有 一 个 
同步 块 ， 锁 就 是 sb 对 象 。 虚 拟 机 观察 变量 sb， 很 快 就 会 发 现 它 的 动态 作用 域 被 限制 在 
concatString() 方 法 的 内 部 。 也 就 是 sb 的 所 有 引用 永远 不 会 “逃逸 ”到 concatString() 方 法 之 
外 ， 其 他 线程 无 法 访问 到 它 ， 所 以 这 里 虽然 有 锁 ， 但 是 可 以 被 安全 地 消除 掉 ， 在 即时 编译 
之 后 ， 这 段 代 码 就 会 忽略 掉 所 有 的 同步 而 直接 执行 了 。 


17.2.3” 锁 膨胀 


原则 上 ， 我 们 在 编写 代码 的 时 候 ， 总 是 推荐 将 同步 块 的 作用 范围 限制 得 尽量 小 一 一 只 
在 共享 数据 的 实际 作用 域 中 才 进 行 同步 ， 这 样 是 为 了 使 得 需要 同步 的 操作 数量 尽 可 能 变 
小 ， 如 果 存 在 锁 竞 争 ， 那 等 待 锁 的 线程 也 能 尽快 地 拿 到 锁 。 

大 部 分 情况 下 ， 上 面 的 原则 都 是 正确 的 ， 但 是 如 果 一 系列 的 连续 操作 都 对 同一 个 对 象 
反复 加 锁 和 解锁 ， 甚 至 加 锁 操作 是 出 现在 循环 体 中 的 ， 那 即使 没有 线程 竞争 ， 频 繁 地 进行 
互 斥 同步 操作 也 会 导致 不 必要 的 性 能 损耗 。 演 示 代 码 17-6 中 连续 的 append() 方 法 就 属于 这 
类 情况 。 如 果 虚 拟 机 探测 到 有 这 样 一 串 零碎 的 操作 都 对 同一 个 对 象 加 锁 ， 将 会 把 加 锁 同 步 
的 范围 扩展 ( 粗 化) 到 整个 操作 序列 的 外 部 ， 以 演示 代码 17-6 为 例 ， 就 是 扩展 到 第 一 个 
append() 操 作 之 前 直至 最 后 一 个 append0 操 作 之 后 ， 这 样 只 需要 加 锁 一 次 就 可 以 了 。 


17.2.4” 轻 量 级 锁 


轻 量 级 锁 是 JDK 1.6 中 加 入 的 新 型 锁 机 制 ， 它 名 字 中 的 “ 轻 量 级 ”是 相对 于 使 用 操作 
系统 互 斥 量 来 实现 的 传统 锁 而 言 的 ， 因 此 传统 的 锁 机 制 就 被 称 为 “重量 级 ” 锁 。 首 先 需 要 
强调 一 点 的 是 ， 轻 量 级 锁 并 不 是 用 来 代替 重量 级 锁 的 ， 它 的 本 意 是 在 没有 多 线程 竞争 的 前 
提 下 ， 减 少 传统 的 重量 级 锁 使 用 操作 系统 互 斥 量 产 生 的 性 能 消耗 。 

要 理解 轻 量 级 锁 ， 以 及 后 面 会 讲 到 的 偏向 锁 的 原理 和 运作 过 程 ， 必 须 从 HotSpot 虚拟 
机 的 对 象 (对 象 头 部 分 ) 的 内 存 布局 开始 介绍 。HotSpot 虚拟 机 的 对 象 头 (Object Header) 分 为 
两 部 分 信息 ， 第 一 部 分 用 于 存储 对 象 自 身 的 运行 时 数据 ， 如 哈 希 码 (HashCode)、GC 分 代 
年 龄 (Generational GC Age) 等 ， 这 部 分 数据 的 长 度 在 32 位 和 64 位 的 虚拟 机 中 分 别 为 32 个 
和 64 个 Bits， 官 方 称 它 为 “Mark Word”， 它 是 实现 轻 量 级 锁 和 偏向 锁 的 关键 。 另 外 一 部 
分 用 于 存储 指向 方法 区 对 象 类 型 数据 的 指针 ， 如 果 是 数组 对 象 的 话 ， 还 会 有 一 个 额外 的 部 
分 用 于 存储 数组 长 度 。 

对 象 头 信息 是 与 对 象 自身 定义 的 数据 无 关 的 额外 存储 成 本 ， 考 虑 到 虚拟 机 的 空间 效 
率 ，Mark Word 被 设计 成 一 个 非 固定 的 数据 结构 以 便 在 极 小 的 空间 内 存储 尽量 多 的 信息 ， 
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它 会 根据 对 象 的 状态 复 用 自己 的 存储 空间 。 例 如 在 32 位 的 HotSpot 虚拟 机 中 对 象 未 被 锁定 
的 状态 下 ，Mark Word 的 32 个 Bits 空间 中 的 25Bits 用 于 存储 对 象 哈 希 码 (HashCode)， 
4Bits 用 于 存储 对 象 分 代 年 龄 ，2Bits 用 于 存储 锁 标志 位 ，1Bit 固定 为 0， 在 其 他 状态 ( 轻 量 
级 锁定 、 重 量 级 锁定 、GC 标记 、 可 偏向 ) 下 对 象 的 存储 内 容 如 表 17-1 所 示 。 


表 17-1 HotSpot 虚拟 机 对 象 头 Mark Word 


存储 内 容 状 态 
对 象 哈 希 码 、 对 象 分 代 年 龄 未 锁定 
指向 锁 记录 的 指针 轻 量 级 锁定 
指向 重量 级 锁 的 指针 膨胀 (重量 级 锁定 ) 
空 ， 不 需要 记录 信息 GC 标记 
偏向 线程 ID、 偏向 时 间 戳 、 对 象 分 代 年 龄 可 偏向 


简单 地 介绍 完了 对 象 的 内 存 布局 ， 我 们 把 话题 返回 到 轻 量 级 锁 的 执行 过 程 上 。 在 代码 
进入 同步 块 的 时 候 ， 如 果 此 同步 对 象 没 有 被 锁定 ( 锁 标 志 位 为 “01” 状 态 )， 虚 拟 机 首先 将 
在 当前 线程 的 栈 帧 中 建立 一 个 名 为 锁 记 录 (Lock Record) 的 空间 ， 用 于 存储 锁 对 象 目前 的 
Mark Word 的 拷贝 (官方 把 这 份 拷贝 加 了 一 个 Displaced 前 级 ， 即 Displaced Mark Word)， 这 
时 候 线程 堆栈 与 对 象 头 的 状态 如 图 17-1 所 示 。 然 后 ， 虚 拟 机 将 使 用 CAS 操作 尝试 将 对 象 
的 Mark Word 更 新 为 指向 Lock Record 的 指针 。 如 果 这 个 更 新 动作 成 功 了 ， 那 么 这 个 线程 
就 拥有 了 该 对 象 的 锁 ， 并 且 对 象 Mark Word 的 锁 标 志 位 (Mark Word 的 最 后 两 个 Bits) 将 转 
变 为 “00”， 即 表示 此 对 象 处 于 轻 量 级 锁定 的 状态 ， 这 时 候 线程 堆栈 与 对 象 头 的 状态 如 
17-2 所 示 。 
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17-1 ， 轻 量 级 锁 CAS 操作 之 前 堆栈 与 对 象 的 状态 
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17-2， 轻 量 级 锁 CAS 操作 之 后 堆栈 与 对 象 的 状态 


多 行 ,aa 起 所 机 本 公 ， 


Ci 权衡 优化 、 高 效 和 安全 的 最 优 方案 


注意 : 上 述 图 17-1 和 图 17-2 来 源 于 大 师 Paul Hohensee 所 写 的 PPT《The Hotspot Java 
Virtual Machine》 。 

如 果 这 个 更 新 操作 失败 了 ， 虚 拟 机 首先 会 检查 对 象 的 Mark Word 是 否 指向 当前 线程 的 
栈 帧 ， 如 果 是 就 说 明 当 前 线程 已 经 拥有 了 这 个 对 象 的 锁 ， 可 以 直接 进入 同步 块 继续 执 行 ， 
否则 说 明 这 个 锁 对 象 已 经 被 其 他 线程 抢占 了 。 如 果 有 两 条 以 上 的 线程 争 用 同一 个 锁 ， 那 轻 
量 级 锁 就 不 再 有 效 ， 要 膨胀 为 重量 级 锁 ， 锁 标志 的 状态 值 变 为 10，Mark Word 中 存储 的 就 
是 指向 重量 级 锁 ( 互 斥 量 ) 的 指针 ， 后 面 等 待 锁 的 线程 也 要 进入 阻塞 状态 。 

上 面 描述 的 是 轻 量 级 锁 的 加 锁 过 程 ， 它 的 解锁 过 程 也 是 通过 CAS 操作 来 进行 的 ， 如 
果 对 象 的 Mark Word 仍然 指向 着 线程 的 锁 记 录 ， 那 就 用 CAS 操作 把 对 象 当前 的 MarkWord 
和 线程 中 复制 的 Displaced Mark Word 蔡 换 回来 ， 如 果 蔡 换 成 功 ， 整 个 同步 过 程 就 完成 
了 。 如 果 蔡 换 失 败 ， 说 明 有 其 他 线程 尝试 过 获取 该 锁 ， 那 就 要 在 释放 锁 的 同时 ， 唤 醒 被 挂 
起 的 线程 。 

轻 量 级 锁 能 提升 程序 同步 性 能 的 依据 是 “对 于 绝 大 部 分 的 锁 ， 在 整个 同步 周期 内 都 是 
不 存在 竞争 的 ”， 这 是 一 个 经 验 数据 。 如 果 没 有 竞争 ， 轻 量 级 锁 使 用 CAS 操作 避免 了 使 
用 互 斥 量 的 开销 ， 但 如 果 存 在 锁 竞 争 ， 除 了 互 斥 量 的 开销 外 ， 还 额外 发 生 了 CAS 操作 ， 
因此 在 有 竞争 的 情况 下 ， 轻 量 级 锁 会 比 传统 的 重量 级 锁 更 慢 。 


17.2.5 ”偏向 锁 


偏向 锁 也 是 JDK 1.6 中 引入 的 一 项 锁 优 化 ， 它 的 目的 是 消除 数据 在 无 竞争 情况 下 的 同 
步 原 语 ， 进 一 步 提 高 程序 的 运行 性 能 。 如 果 说 轻 量 级 锁 是 在 无 竞争 的 情况 下 使 用 CAS 操 
作 去 消除 同步 使 用 的 互 斥 量 ， 那 偏向 锁 就 是 在 无 竞争 的 情况 下 把 整个 同步 都 消除 掉 ， 连 
CAS 操作 都 不 做 了 。 

偏向 锁 的 “ 偏 ”， 就 是 偏心 的 “ 偏 ”、 偏 祖 的 “ 偏 ”。 它 的 意思 是 这 个 锁 会 偏向 于 第 
一 个 获得 它 的 线程 ， 如 果 在 接 下 来 的 执行 过 程 中 ， 该 锁 没 有 被 其 他 的 线程 获取 ， 则 持 有 偏 
向 锁 的 线程 将 永远 不 需要 再 进行 同步 。 

如 果 读 者 读 懂 了 前 面 轻 量 级 锁 中 关于 对 象 头 Mark Word 与 线程 之 间 的 操作 过 程 ， 那 偏 
向 锁 的 原理 理解 起 来 就 会 很 简单 。 假 设 当前 虚拟 机 启用 了 偏向 锁 ( 启 用 参数 -XX:+ 
UseBiasedLocking， 这 是 JDK 1.6 的 默认 值 )， 那 么 ， 当 锁 对 象 第 一 次 被 线程 获取 的 时 候 ， 
虚拟 机 将 会 把 对 象 头 中 的 标志 位 设 为 “01”， 即 偏向 模式 。 同 时 使 用 CAS 操作 把 获取 到 
这 个 锁 的 线程 的 ID 记录 在 对 象 的 Mark Word 之 中 ， 如 果 CAS 操作 成 功 ， 持 有 偏向 锁 的 线 
程 以 后 每 次 进入 这 个 锁 相 关 的 同步 块 时 ， 虚 拟 机 都 可 以 不 再 进行 任何 同步 操作 ， 例 如 
Locking、Unlocking 及 对 Mark Word 的 Update 等 。 

当 有 另外 一 个 线程 去 尝试 获取 这 个 锁 时 ， 偏 向 模式 就 宣告 结束 。 根 据 锁 对 象 目前 是 否 
处 于 被 锁定 的 状态 ， 撤 销 偏向 (Revoke Bias) 后 恢复 到 未 锁定 (标志 位 为 “01”) 或 轻 量 级 锁定 
(标志 位 为 “00”) 的 状态 ， 后 续 的 同步 操作 就 如 上 面 介 绍 的 轻 量 级 锁 那 样 执行 。 偏 向 锁 、 
轻 量 级 锁 的 状态 转化 及 对 象 Mark Word 的 关系 如 图 17-3 所 示 。 
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分 配对 象 


如 果 仿 向 锁 可 用 如 果 偏向 镇 不 可 用 
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17-3 ”偏向 锁 、 轻 量 级 锁 的 状态 转化 及 对 象 Mark Word 的 关系 


偏向 锁 可 以 提高 带 有 同步 但 无 竞争 的 程序 性 能 。 它 同样 是 一 个 带 有 效益 权衡 (Trade Off) 
性 质 的 优化 ， 也 就 是 说 它 并 不 一 定 总 是 对 程序 运行 有 利 ， 如 果 程 序 中 大 多 数 的 锁 都 总 是 被 
多 个 不 同 的 线程 访问 ， 那 偏向 模式 就 是 多 余 的 。 在 具体 问题 具体 分 析 的 前 提 下 ， 有 时 候 使 
用 参数 -XX:-UseBiasedLocking 来 禁止 偏向 锁 优 化 反而 可 以 提升 性 能 。 

在 JDK6 中 ， 偏 向 锁 是 默认 启用 的 。 它 提高 了 单线 程 访 问 同步 资源 的 性 能 。 但 试想 一 
下 ， 如 果 你 的 同步 资源 或 代码 一 直 都 是 多 线程 访问 的 ， 那 么 消除 偏向 锁 这 一 步骤 对 你 来 说 
就 是 多 余 的 。 事 实 上 ， 消 除 偏向 锁 的 开销 还 是 蛮 大 的 。 所 以 在 你 非常 熟悉 自己 代码 的 前 提 
下 ， 建 议 禁 用 偏向 锁 -XX:-UseBiasedLocking。 
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